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INTRODUZIONE 


L'avvento e la diffusione su scala planetaria delle reti telematiche (In- 
ternet e il World Wide Web) hanno radicalmente trasformato le modalità 
di comunicazione. La rete, intesa sia come infrastruttura tecnologica sia 
come comunità sociale globale, è lo spazio in cui, in misura sempre cre- 
scente, si creano e si disseminano informazioni, dati, conoscenze e com- 
petenze. 

Questo libro considera un ambito o “campo” particolare della comu- 
nicazione in rete: quello relativo alla scienza. 

Nonostante questa preliminare restrizione di campo, il tema qui af- 
frontato non riguarda una questione specialistica o settoriale, che inte- 
ressa solo il mondo accademico. La scienza infatti è un commons, un 
bene di tutti, che esce dall'accademia attraverso le aule delle università, e 
tramite la divulgazione dei suoi risultati raggiunge, oltre ai ricercatori 
stessi, diversi destinatari: imprese, insegnanti, politici e cittadini. La 
scienza, si può dire, riguarda tutti. 

Affronteremo il rapporto tra la scienza e la rete a partire da due que- 
stioni preliminari. 

Primo: perché la società ha bisogno di una scienza libera? A questo, 
tra l'altro, risponde Kant nella Risposta alla domanda: che cos'è l'illumini- 
smo? del 1784!, alla vigilia della Rivoluzione Francese. L'uso pubblico 
della ragione, l'uso cioè che uno fa del logos «in quanto studioso, davanti 
all'intero pubblico dei lettori» [A 485], dev'essere libero, perché solo così 
può attecchire l'abitudine al pensare da sé, al Selbstdenken. Esercitare l'u- 
so pubblico della ragione, se è difficile per il singolo individuo, è possibi- 
le per il pubblico. Il rischiaramento può avvenire collettivamente, come 
fenomeno storico-culturale, una volta che al singolo sia lasciata la libertà 
di ragionare pubblicamente su scienza, religione e politica; anzi, aggiun- 
ge Kant, che ciò accada è «persino inevitabile». Affinché i singoli possano 
pensare autonomamente, dev'essere possibile discutere pubblicamente di 
scienza. Solo così può germogliare la vocazione al libero pensiero, il qua- 
le «allora agisce a sua volta gradualmente sul modo di sentire del popolo 
(attraverso la qual cosa questo diventerà più e più capace della libertà di 
agire), e alla fine addirittura sui principi del governo» [A 493-4]. La ri- 


1], Kant, Risposta alla domanda: Che cos'è l'illuminismo? (tr. it. di F. Di Donato), 
«Bollettino telematico di filosofia politica», <http://bfp.sp.unipi.it/classici/illu.html> 
(ed. orig. 1784). 
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sposta di Kant alla nostra prima questione è che la libertà della scienza è 
condizione della libertà politica. In termini più attuali, potremmo dire 
che la libertà della ricerca è un prerequisito di una società liberale e de- 
mocratica. 

La seconda questione riguarda il rapporto tra lo statuto della scienza 
in una data cultura e il modo in cui è prodotta e veicolata. È un tema le- 
gato alla stessa nascita del pensiero filosofico occidentale, sorto in un'e- 
poca di rivoluzione mediatica che ha visto il passaggio dall'oralità alla 
scrittura. Platone lo affronta nel Fedro?, un dialogo che ha al centro la co- 
municazione scientifica, affermando che i contesti in cui si determina il 
modo in cui si usano le tecnologie di comunicazione condizionano i gra- 
di di libertà della scienza. Platone dunque afferma che il mezzo non è 
neutro, presenta limiti e possibilità. Ma l'effetto che produce dipende da 
come lo si usa, all'interno di questi limiti. 

Nel Fedro, in risposta al Mito di Teuth (274e-275a), Socrate afferma 
infatti che la scrittura é un pharmakon che, in quanto tale, puó avere ef- 
fetti tanto benefici quanto dannosi: essa aiuta a conservare e a trasmette- 
re l'informazione, anche se non aumenta la memoria e la capacità di ra- 
gionare di chi la usa, e non é uno strumento interattivo (275c e segg.). 

Ma nel dialogo, Socrate fa anche due discorsi orali, il primo dei quali, 
pronunciato a capo coperto, viene poi sottoposto da Socrate stesso a una 
severa critica scientifica. E attraverso il mito delle cicale formula un fero- 
ce attacco ai poeti, il cui suono è ripetitivo e non dice nulla (258e-259d). 

Platone distingue dunque tra hypómnesis, il bagaglio di nozioni che si 
possiedono, e anamnesis, la loro interconnessione sistematica, secondo 
un senso unitario e coerente. La componente nozionistica (hypomnesis) 
puó diventare conoscenza scientifica solo se elaborata criticamente attra- 
verso l'anamnesis e in modo interattivo. Mettendo al centro il logos filo- 
sofico, il filosofo critica la politica culturale dei sofisti, da una parte, e 
della cultura tradizionale (orale) dall'altra. Il logos filosofico puó dunque 
esplicarsi attraverso diversi mezzi, l'importante è che tali mezzi siano 
usati con scienza, poiché il modo in cui si fa scienza e la si comunica è 
una questione politica. Un tema, questo che sarà ripreso più volte nella 
storia del pensiero occidentale. Basti pensare ancora una volta al dibatti- 
to illuminista tedesco dell'ultimo quarto del Settecento su stampa, diritto 
d'autore e scienza, cui prese parte lo stesso Kant’. 

Questo libro si propone dunque di affrontare il rapporto tra la scienza 
e la rete cercando risposte a una triplice domanda: la rete consente il li- 
bero esercizio dell'uso pubblico della ragione? Entro quali limiti? E quali 
possibilità possono essere esplorate, in tal senso? 


? Platone, Fedro, (tr. it. di P. Pucci) Laterza, Roma-Bari 1966-2000. 
3 Si veda su questo la preziosa raccolta R. Wittman (a cura di), Nachdruck und 
geistiges Eigentum, Kraus International Publications, München 1981. 
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Il primo capitolo funge da premessa, ed è dedicato a ricostruire le cir- 
costanze in cui ha avuto origine il sistema moderno di comunicazione 
della scienza, dalla nascita del peer review e delle riviste scientifiche fino 
al sorgere degli indici bibliometrici di valutazione, per mettere in luce gli 
effetti di tali strumenti sul modo in cui si costruisce lo statuto di sapere 
scientifico. In The Bias of Communication, Harold A. Innis ha mostrato 
come «un monopolio o un oligopolio della conoscenza si costruiscono 
sino al punto in cui l'equilibrio viene disturbato»*. Osserveremo dunque 
come oggi la rivoluzione mediatica in atto stia cambiando le carte in ta- 
vola e rompendo parte di quegli equilibri. 

Il secondo capitolo ricostruisce quindi la storia del World Wide Web. 
La ragnatela globale dell'informazione è stata pensata sin dal principio in 
analogia con il sistema di comunicazione scientifica tradizionale, ma si 
basa su principi architettonici diversi, primo tra tutti l'universalità del si- 
stema. Vale a dire che chiunque può pubblicare sul Web senza la necessi- 
tà di alcun filtro preliminare, una caratteristica che dipende da scelte tec- 
niche, oltre che filosofiche. 


Le strutture sociali del Web dipendono dall'ingegneria che sta sotto 
alla sua architettura di alto livello. Comprendere la relazione tra uma- 
nità e tecnologia e le implicazioni, per la società umana, dell'essere 
animali che fanno uso di strumenti, è stato un tratto distintivo di 
gran parte della riflessione filosofica, politica e sociale dall'Illumini- 
smo in avanti, per esempio nell'opera di Marx e di Heidegger. Il Web 
riflette la nostra vita intellettuale e sociale, ma è anche stato specifica- 
mente costruito per essere uno strumento”. 


Un'analisi degli aspetti tecnici più profondi, accompagnata da uno 
sforzo di tradurli in termini comprensibili agli studiosi di scienze umane 
e sociali, risulta dunque essenziale per coglierne le implicazioni filosofi- 
che e socio-politiche. Ma il Web ha introdotto altre innovazioni radicali 
che trasformano il modo di fare scienza in direzioni affatto nuove e rivo- 
luzionarie, e che si scontrano con alcuni postulati della comunicazione 
scientifica moderna, violando molti dei principi base delle scienze biblio- 
grafiche e rendendo difficile certificare la qualità e l'autenticità di un do- 
cumento. Perciò, nel terzo capitolo si indicano nelle recenti evoluzioni 
della ragnatela globale, sia da un punto di vista tecnico e filosofico (Web 
semantico), sia su un piano sociale e culturale (Web 2.0), possibili solu- 
zioni a quei problemi. 


4 H.A. Innis, Le tendenze della comunicazione, SugarCo, Milano 1982 (ed. orig. 
1951), p. 26. 

5 T. Berners-Lee, W. Hall, J.A. Hendler, K. O'Hara, N. Shadbolt and D.J. Weitzner, 
A Framework for Web Science, Foundations and Trends in Web Science, 1, 1, 2006, 
<http://eprints.ecs.soton.ac.uk/13347/>, p. 82. 


12 LA SCIENZA E LA RETE 


Infine, l'ultimo capitolo considera l'impatto delle nuove tecnologie 
sulla comunicazione scientifica, sia nelle esperienze più conservatrici, 
che si propongono di adattare gli strumenti tradizionali ai nuovi mezzi, 
sia in quelle che si poggiano sulla filosofia alla base di Internet, del Web e 
del movimento per la libertà del software e che mirano a fare della cono- 
scenza un bene comune. «Tra le sfide che la rete pone alla formazione 
universitaria non può essere ignorato il compito di mantenere alle cono- 
scenze che essa permette di diffondere a fini educativi lo statuto di bene 
pubblico globale»*. Una sfida che le università, i centri di ricerca e i ricer- 
catori tutti sono chiamati a raccogliere, come la storia di Alice, nelle con- 


clusioni, cerca di mostrare. 
+ 


Desidero in primo luogo ringraziare gli studenti che hanno frequen- 
tato i corsi e i seminari che ho tenuto, dal 2004 ad oggi, presso la Facolta 
di Scienze politiche dell'Ateneo pisano. Il loro entusiasmo e le loro osser- 
vazioni sono stati uno stimolo prezioso. Ringrazio inoltre Alessandro 
Breccia, Francesca Carpita, Francesca Menchelli-Buttini, Chiara Pasqui- 
nelli, Ilaria Possenti, Irene Psaroudakis, ricercatori non strutturati dell'U- 
niversità di Pisa, che nell'inverno 2009 hanno partecipato a un corso 
ospitato dal CISIAU della Facoltà di Lettere pisana. 

Un pensiero particolare va alla professoressa Elisabetta Marini, per 
avermi invitato a partecipare al Corso del Master in comunicazione della 
scienza presso l'Università di Cagliari, e al professor Mario Aldo Tosca- 
no, che ha ospitato un analogo ciclo di lezioni rivolto agli studenti del 
corso di Dottorato in Storia e sociologia della modernità del Dipartimen- 
to di Scienze e politiche e sociali di Pisa. 

La mia gratitudine va anche ai membri dell'Azione COST A32 “Open 
Scholarly Communities on the Web’, in particolare Paolo D'Iorio, Hans 
Walter Gabler e Matteo D'Alfonso, per i fruttosi scambi di questi anni. 

Questo libro non sarebbe stato concepito senza la guida severa e l'al- 
legria dissacrante di Michele Barbera, che mi ha iniziato allo studio del- 
l'informatica e nei cui confronti ho contratto il debito maggiore. Sono 
inoltre molto grata a Maria Chiara Pievatolo, che ormai da dieci anni co- 
stituisce un insostituibile punto di riferimento. 

Infine, grazie a Emanuela, Francesca, Irene, Massi, il calore della cui 
amicizia mi ha scaldato anche nei momenti peggiori. E a C., che c'è sem- 


pre. 


6 L. Gallino, Tecnologia e democrazia. Conoscenze tecniche e scientifiche come beni 
pubblici, Einaudi, Torino 2007, p. 229. 


CAPITOLO 1 


IL SISTEMA TRADIZIONALE DI COMUNICAZIONE 
NELLA SCIENZA 


1. La nascita della comunicazione scientifica moderna 


Gli elementi che hanno caratterizzato il sistema tradizionale di comu- 
nicazione in campo scientifico, un sistema che è rimasto per lo più inal- 
terato fino all'ultimo quarto del secolo scorso, si definirono in Europa, e 
in particolare in Inghilterra, tra la fine del diciassettesimo secolo e i pri- 
mi decenni del successivo. Se l'universalità della scienza è il risultato di 
un lungo processo di transizione, fu in Inghilterra, grazie soprattutto alla 
diffusione che la stampa ebbe in quel preciso contesto storico, culturale e 
politico!, che tale processo raggiunse una forma definita e pressoché defi- 
nitiva: presso la Royal Society di Londra nacque la prima rivista scientifi- 
ca e si delinearono le pratiche di accreditamento scientifico tutt'oggi in 
vigore, in particolare il processo di peer reviewing’; nella dialettica del 
rapporto tra la gilda degli stampatori e dei librai e gli autori si definirono 
inoltre i concetti di copyright e di autore come soggetto di diritti. 

Perciò, tentare di ricostruire il rapporto che esiste tra la diffusione 
della stampa e l'evoluzione del discorso scientifico - sia per quanto ri- 
guarda il merito, vale a dire la costruzione della verità del sapere; sia nel 
metodo, attraverso un meta-discorso sui mezzi di comunicazione -, è es- 


1 Lo storico Adrian Johns ha in particolare ricostruito il processo tramite cui i te- 
sti stampati, in primo luogo scientifici, sono divenuti portatori di verità (cfr. A. Johns, 
The Nature of the Book. Print and Knowledge in the Making, Chicago University Press, 
Chicago 1998). Al centro della sua analisi è la costruzione del credito e della fiducia 
(trust), un elemento chiave nel creare conoscenza. I processi tramite i quali si decide 
a chi credere e a che cosa dare credito sono due problemi gemelli, che spesso sono 
stati combinati in uno solo. Gli storici della stampa si sono interrogati sul fondamen- 
to della convinzione che la cultura abbia reso possibile stabilire un sapere vero nella 
società moderna. Johns, contro altri (in particolare Einsenstein e McLuhan), sostiene 
che la creazione della “verità” è estrinseca alla stampa in sé, e ricostruisce come vi è 
stata inglobata. 

2 Secondo David A. Kronick, la pratica del peer reviewing sarebbe in realtà stata 
definita presso la Royal Society of Edimburgh nel 1731 (Peer review in 18th century 
scientific journalism, «JAMA», 263, 10, 1990). Mi paiono tuttavia più attendibili al ri- 
guardo le ricostruzioni di Adrian Johns e di Mario Biagioli (From Book Censorship to 
Academic Peer Review, «Emergences», 12, 1, 2002, pp. 91-1 18). 
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senziale a comprendere come si è configurato il sistema della comunica- 
zione scientifica tradizionale, un sistema che proprio di recente è stato 
sconvolto dall'avvento di Internet e del Web, e le cui convenzioni formali 
fino a quel momento valide e riconosciute risalgono alla fine del '600. 

Dalla seconda metà del diciassettesimo secolo Londra, sede della Sta- 
tioners' Company, la corporazione degli stampatori e dei librai ricono- 
sciuta legalmente dalla regina Mary nel 1557 «to oversee the 'art and my- 
stery of printing», divenne il centro del mercato librario. Formalmente, 
tutti coloro che erano coinvolti nella pubblicazione di libri, riviste, gior- 
nali, rientravano nella categoria di Stationer, cioé di membri della com- 
pagnia che comprendeva i ruoli distinti e articolati di bookseller, printer, 
wholesaler, publisher, editor e compositor. L'attività degli Stationers condi- 
zionava fortemente la pratica scientifica: il significato e la comunicazione 
del sapere di ogni tipo dipendevano sempre piü dalla stampa, ed era at- 
traverso l'azione degli Stationers che i materiali stampati vedevano la luce 
e raggiungevano il loro pubblico. In questo senso, si puó affermare che il 
sapere dipendeva dagli Stationers. Lo stesso Locke denunciava il fatto 
che 


il monopolio degli autori classici tenuto dalla Company of Stationers 
significava che essi erano "scandalosamente male stampati, sia per 
quanto riguarda i caratteri, la stampa e la correttezza, e a mala pena 
viene prodotta un'edizione tollerabile’, “.. la nostra stampa è cosi 
sgradevole e tuttavia così cara in Inghilterra”4. 


Nei distretti della capitale del Regno Unito avveniva lo scambio dei li- 
bri (anche continentali); fu così che i distretti dedicati al commercio li- 
brario giunsero a delineare una specie di università de facto: come scrive- 
va Thomas Sprat, autore della storia della Royal Society, «not only the 
best Natural, but the best Moral Philosophy too, may be learn'd from the 
shop of Mechanicks»°. 

In questa prima fase, nessuna stamperia londinese poteva permettersi 
di specializzarsi nella sola letteratura scientifica, che aveva un mercato 
molto ristretto ed era un'intrapresa ad alto rischio. Un esempio illustre fu 
l'English Atlas di Pitt, la cui pubblicazione, nonostante le ottime creden- 
ziali (e il patrocinio scientifico della Royal Society) si arrestò al primo 
volume degli undici previsti. Per pubblicare un'opera, agli autori (fossero 
essi Newton, Boyle, Hobbes o Flamsteed) erano necessari ingenti finan- 


3 A. Johns, The Nature of the Book, cit., p. 60. 

4 L. King (a cura di), The Life and Letters of John Locke, Garland, New York, 1984 
(ed. orig. 1864), pp. 204-07; cit. da H.A. Innis, Le tendenze della comunicazione, cit., 
p. 165. 

5 Citato da A. Johns, The Nature of the Book, cit., p. 74. Col termine Mechanick si 
intendevano gli stampatori. In Europa, che il sapere filosofico vivesse nei negozi così 
come nei libri e nelle accademie era una idea nota e condivisa. 
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ziamenti, e i libri scientifici erano una merce cara, sia da produrre che da 
comprare. Anche per questo, la prima e più importante difficoltà per un 
autore consisteva nel persuadere uno Stationer a stampare. Fu certamen- 
te anche a causa di tali difficoltà che i filosofi naturali della Royal Society, 
autori di libri destinati a un pubblico erudito e a un mercato di nicchia, 
inaugurarono e sperimentarono soluzioni che consentirono loro di cre- 
arsi uno spazio di autonomia nel mondo degli Stationers’. 

La comunicazione era essenziale per la Royal Society, che si autopro- 
clamava “parlamento” intendendosi con ciò rappresentativa della nazio- 
ne, ma si apriva al pubblico (internazionale) dei lettori tramite le pubbli- 
cazioni, che godevano di considerevole fama anche oltre la Manica. Il bi- 
sogno di diffondere i risultati era importante per la filosofia sperimentale 
al pari dell'esperimento, e la prima condizione per essere un filosofo era 
la prontezza a comunicare. 

L'accademia inglese avviò dunque un processo che le consentì di aff- 
rancarsi dalla Compagnia degli Stationers quando ottenne il privilegio di 
stampare opere scientifiche e l'autonomia di scegliere i suoi librai e stam- 
patori?. Infine, il consiglio della Royal Society stabili che nessun libro po- 
tesse ottenere una licenza se non fosse stato prima approvato da almeno 
due membri del consiglio stesso, per assicurare che esso non fosse in al- 
cun modo contrario ai progetti e alle opere della società (una prima for- 
ma di peer review)". 

Fu in tale contesto che nacque un genere di pubblicazioni che si offri- 
va come veicolo regolare per pubblicare articoli che avessero superato la 
valutazione della Società: il periodico scientifico. Come per il Journal des 
scavans, fondato in Francia da Denis de Sallo, il primo numero di The 
Philosophical Transactions apparve nel 1665 a cura di Henry Olden- 
burg!!, segretario, responsabile della corrispondenza e custode dei regi- 


6 Una soluzione che trovò seguito nella Royal Society, e anche altrove in Europa, 
fu l'autofinanziamento da parte degli autori (e tramite gli abbonamenti dei lettori). 
L'ostacolo principale era trovare sottoscrittori che si fidassero dell'iniziativa editoria- 
le. Cfr. su questo anche la proposta del poeta Friedrich Gottlieb Klopstock, che ebbe 
notevole seguito anche presso altri illuministi tedeschi (M. Woodmansee, The Genius 
and the Copyright: Economic and Legal Conditions of the Emergence of the Author’, 
«Eighteenth-Century Studies», 17, 4, 1984, 425-448, in particolare pp. 440-41, 
<http://www.compilerpress.atfreeweb.com/Anno%20Woodmansee%20Genius%20& 
%20Copyright.htm>). 

7 Cfr. T. Sprat, History of the Royal Society, Martyn, London 1667; T. Birch, The 
History of the Royal Society of London,1756, reprinted Johnson, New York 1968. 

8 A. Johns, The Nature of the Book, cit., p. 472. 

9 Nel 1660-61 la Royal Society scelse gli stampatori John Martyn e James Allestry, 
con i quali fu stabilita una rigida convenzione. 

10 Cit. in A. Johns, The Nature of the Book, cit., p. 494. 

11 Oldenburg gestiva la nuova rivista con grande indipendenza dal punto finan- 
ziario ed editoriale e The Philosophical Transactions fu a lungo identificata con la sua 
persona. 
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stri della Society". Il tentativo di Oldenburg era probabilmente mirato a 
estendere il valore del registro dell'accademia inglese al di fuori della So- 
ciety stessa, e il ruolo di editor delle Philosophical Transactions e di guar- 
diano (gatekeeper) del registro si intersecarono costantemente. 

La nascita di questo nuovo genere di pubblicazioni introdusse cam- 
biamenti di notevole rilievo sia nel mercato editoriale, sia nelle forme 
della comunicazione scientifica". Le riviste posero problemi pratici e le- 
gali che non esistevano coi libri: richiedevano licenze aperte e illimitate, 
avevano bisogno di numerosi valutatori e necessitavano di una grande 
quantità di contenuti. Anche per questo, si aprirono al contributo degli 
studiosi esteri favorendo l'internazionalizzazione della scienza. Lentezza 
delle pubblicazioni, plagio, conflitti personali e politici oltre che scientifi- 
ci, comportamenti fraudolenti, bassa expertise, eccessivo conservatori- 
smo cominciarono allora ad essere denunciati come fenomeni negativi. 

Anche la nascita del peer review in senso proprio, un momento deci- 
sivo per la costruzione del credito del sapere scientifico e della conse- 
guente fiducia da parte del pubblico, viene fatta coincidere con quella del 
primo periodico scientifico, le appena citate Philosophical Transactions. 
La Royal Society dovette infatti confrontarsi direttamente con l'elabora- 
zione di convenzioni sicure per la produzione, la manipolazione e la rice- 
zione di oggetti scritti e stampati che contenevano teorie di filosofia na- 
turale al fine di difendere il proprio privilegio, che la Corona avrebbe po- 
tuto revocare in qualunque momento. Fu in tale contesto che i membri 
dell'accademia inglese dettero vita alle prime pratiche di revisione da 
parte di pari: presentazione e “lettura attenta” (perusal), più una forma di 
registrazione molto simile a quella che avveniva nella gilda degli Statio- 
ner. La presentazione era un atto pubblico, spesso mediato dal segretario 
della società, che divenne obbligatorio dal maggio 1661: ogni membro 
che pubblicava un'opera doveva donarne una copia alla Royal Society; in 


12 Se il periodico francese e la rivista inglese sono stati spesso equiparati, «la pub- 
blicazione francese rifletteva in realtà il modello degli scambi epistolari manoscritti, 
in qualche modo pettegoli e orientati alla notizia, che erano così tipici della Repub- 
blica delle Lettere; come tale, è più vicina a qualcosa come lo Scientific American, 
piuttosto che a una rivista accademica moderna, e perciò appare saldamente radicata 
nell'arte emergente del giornalismo scientifico. Sebbene la rivista pubblicasse occa- 
sionalmente articoli originali, essi apparivano come una espressione particolare di 
notizie fra altri tipi di notizie. Di contro Philosophical Transactions, sebbene trattasse 
anch'esso di nuova informazione, mirava in realtà a creare un registro pubblico di 
contributi originali alla conoscenza. In altri termini, la pubblicazione parigina anda- 
va dietro alla novità, mentre la rivista londinese contribuiva a corroborare l'originali- 
tà. In questo consiste la differenza significativa (e profonda) fra i due periodici». J.-C. 
Guédon, Per la pubblicità del sapere. I bibliotecari, i ricercatori, gli editori e il controllo 
dell'editoria scientifica, PLUS, Pisa 2004 (ed. orig. 2001), p. 18. 

13 Per una rassegna sulla storia dei periodici in Europa, cfr. B. Dooley, S. Baron (a 
cura di), The Politics of Information in Early Modern Europe, Routledge, New York 
2001. 
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seguito, il dono meritava una risposta: di solito un fellowship. La “lettura 
attenta” consisteva in un'analisi approfondita dell'opera da parte di spe- 
cialisti della medesima accademia. Il giudizio dei valutatori doveva esse- 
re comunicato all'autore e le conclusioni di questi ultimi non dovevano 
espressamente essere rese pubbliche. 

Dopo la “lettura attenta” le opere venivano inserite in un registro che 
ricalcava il registro delle copie della compagnia degli Stationer, un volu- 
me scritto a mano e custodito dal clerk della compagnia, che offriva a co- 
lui che registrava un testo un diritto perpetuo sulla base delle convenzio- 
ni della gilda stessa! La registrazione, affermava Boyle, avveniva «[to] 
secure [authors] against the usurpations, not the industry or out-doings 
of others», dunque per stabilire la priorità di un individuo in una sco- 
perta scientifica. Dei due registri esistenti, un libro era dedicato alle lette- 
re, l'altro alle teorie (ipotesi), e l'accesso (a entrambi) era limitato. Si os- 
servi inoltre che l'accademia inglese si riservava il diritto di modificare le 
opere prima di registrarle. La procedura suggerita da Oldenburg per assi- 
curare la paternità delle invenzioni ai loro autori e per prevenirne l'usur- 
pazione divenne così un protocollo. Tuttavia, il ruolo della Royal Society 
fu sempre fragile e l'autorità dei registri non si estese al di fuori della co- 
munità accademica. 

Nella pratica di peer review messa in atto dal periodico inglese, era la 
rivista intera a essere sottoposta a giudizio, e non come oggi i singoli ar- 
ticoli. Almeno al principio, inoltre, gli stessi contenuti erano difficilmen- 
te riconducibili a un autore altro da Oldenburg, che, pur ricevendo ma- 
noscritti anche dall'estero, pubblicava più parafrasi di suo pugno e brevi 
report anonimi che testi originali. Una particolare caratteristica del siste- 
ma di comunicazione scientifica inglese era il fatto che il processo di peer 
review si applicava ai prodotti domestici (e avveniva all'interno della 
Royal Society), e la censura interessava invece i libri importati dall'estero. 
I “pari” dunque erano tra loro connazionali!. Grazie alle pubblicazioni, 
le accademie reclutavano nuovi eruditi, ampliavano le loro reti e incorag- 
giavano listituzione di nuove accademie. Nel rapporto tra scienziati e 
politica, il peer review era importante perché la credibilità (e l'indipen- 
denza) dell'istituzione dipendevano dalla credibilità dei testi pubblicati e 
dalla rete di scambi filosofici dei membri dell'accademia. Perció, il peer 
review fu in principio uno strumento prudenziale, e assai difficilmente 


14 Una volta registrata da uno Stationer (procedura che avveniva dietro il versa- 
mento di 6 pence), una copia poteva essere venduta, scambiata, suddivisa in parti ma 
la registrazione era il documento che aveva autorità sul diritto consuetudinario. Il si- 
stema comportava inoltre che per verificare lo status di un titolo fossero necessarie 
considerevoli ricerche. A. Johns, The Nature of the Book, cit., pp. 213-16. 

15 Ivi, p. 484. 

16 Fu invece a Parigi che ebbe inizio la valutazione a distanza, che anticipa la pra- 
tica del blind peer review. Cfr. M. Biagioli, From Book Censorship to Academic Peer 
Review, cit. 
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opere innovative passavano il vaglio della Royal Society e venivano date 
alle stampe. 

In generale, la costruzione del credito delle pubblicazioni non avven- 
ne in modo omogeneo. Nel mentre, tuttavia, le pubblicazioni scientifiche 
divennero un requisito necessario per appartenere all'accademia - e le 
pubblicazioni, comparendo sulle riviste accademiche dell'istituzione, da- 
vano prestigio all'istituzione stessa. In questo modo, i manoscritti diven- 
nero portatori di credito. E per il funzionamento del meccanismo, era 
fondamentale che queste “banconote accademiche” fossero stampate”. 

Tra Sei e Settecento il peer review estese la sua giurisdizione. Nato 
come tecnica disciplinare e interna ad accademie specifiche, il suo uso fu 
poi allargato alla valutazione dei risultati degli eruditi in generale. Se non 
è facile distinguere i diversi momenti (presentazione, “lettura attenta”, re- 
gistrazione, pubblicazione) della valutazione, possiamo osservare che fu 
a causa dello stretto legame tra le società scientifiche e i loro periodici 
che il peer review divenne parte integrante nella pubblicazione delle pri- 
me riviste e, per estensione, un protocollo di pubblicazione nella Repub- 
blica delle Lettere del 1700. In seguito, si generalizzò e fu istituzionalizza- 
to come pratica tacita ma universalmente riconosciuta nell'accademia. 

Dal 1662 fu il Press Acta stabilire che alla Royal Society spettasse, per 
prerogativa regia, il privilegio di licenziare i testi per la stampa. Il regime 
del privilegio si intrecciava a quello delle licenze: i licenziatari erano au- 
torità a cui la Corona attribuiva il compito di vagliare il contenuto dei te- 
sti che potevano essere stampati, compito che fino al 1643 era assegnato 
in prevalenza a ecclesiastici, e che a partire da quella data venne attribui- 
to a una nuova categoria di esperti tra cui, nel 1662, rientrò la Royal So- 
ciety. Si osservi che il ruolo di licenziatario era più importante di quello 
di autore, soprattutto in termini di responsabilità nei confronti dei conte- 
nuti di un testo; a prova di ciò sia considerato il fatto che, dal 1677, il 
nome del concessionario della licenza doveva comparire nelle voci dei 
testi incluse nel registro della compagnia degli Stationers (disposizione 
che fu “resa obbligatoria per ordine regio” nel 1685), mentre il nome del- 
l'autore spesso veniva omesso. Elemento, questo, che può essere compre- 
so considerando che l'attribuzione di privilegi e di licenze equivaleva a 
una forma di censura assai efficace e potente, che garantiva un controllo 
assoluto da parte del potere politico sui materiali stampati. 

Un modo affinché un autore potesse ottenere una licenza era persua- 
dere un importante gentleman (ad esempio un Master Printer) a scrivere 
alla corte chiedendo il permesso di stampare un'opera sotto il suo brevet- 
to. A metà del Seicento lo stato e gli Stationers avevano sviluppato un in- 
sieme complesso di procedure per stabilire e regolare la proprietà dei li- 
bri, al cui centro stava il registro delle copie, su cui venivano inseriti tito- 
li, date e, appunto, il nome di chi aveva concesso la licenza. Ma il registro 


17 M. Biagioli, From Book Censorship to Academic Peer Review, cit., p. 20. 
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non era esplicitamente protetto dalla legge; pertanto, “proprietà lettera- 
ria” è un termine anacronistico e sbagliato per il tempo. 

Così, il registro delle copie (di cui a partire dal 1662 si dotò anche la 
Royal Society), le licenze e i privilegi reali divennero elementi fondamen- 
tali per la costruzione del credito dei testi stampati. 


Il regime del privilegio resistette anche all'indebolimento del potere 
monarchico determinato dalla prima e dalla seconda rivoluzione in- 
glese: quando nel 1641 fu abolita la Star Chamber, che assicurava sia 
le licenze di stampa sia il monopolio della Stationers' Company, i 
membri della corporazione presentarono il pamphlet The Humble 
Remonstrance of the Company of Stationers to the High Court of Par- 
liament (1643), che stigmatizzava le Province Unite dei Paesi Bassi 
per la mancanza di regolamentazione che impoveriva gli stampatori e 
impediva loro di operare al servizio dello stato. Il Licensing Order, 
emanato dal Parlamento nel 1643, reintrodusse un regime di mono- 
polio e di censura analogo a quello precedente. Dopo la restaurazione 
del potere monarchico, il Licensing Act (1662) ribadì questa discipli- 
na, che durò fino al 1695 - anno in cui il Licensing Act non fu più 
rinnovato??, 


Fu a partire dal 1695, e poi dal 1710, che la sede decisionale in mate- 
ria di privilegi di stampa e poi di proprietà intellettuale passó dalla corte 
della gilda a quella del common law, un passaggio decisivo per la nascita 
dell'attuale sistema di copyright, che ha trasferito i diritti sulla “copia” dal 
concessionario della licenza all'autore. Fu cosi che 


nel 1710 il parlamento britannico approvó la prima legge europea sul 
copyright, lo Statute of Anne. Per la prima volta, l'autore, in luogo del- 
lo stampatore, é riconosciuto come titolare originario del monopolio 
sulla riproduzione del proprio lavoro. Questo monopolio, peró, non é 
piü perpetuo, bensi temporaneo: il termine é di 21 anni per le opere 
già pubblicate al momento dell'entrata in vigore dello statuto e, per 
tutte le opere uscite dopo, di 14 - raddoppiabili solo con un atto espli- 
cito di volontà dell'autore. Il termine di 14 anni era stato ripreso da 
quello dei brevetti sulle invenzioni stabilito dallo Statute of Monopo- 
lies del 1623: in entrambi i casi, il monopolio era inteso non come 
una proprietà di diritto naturale, ma come una costruzione politica”. 


18 M.C. Pievatolo, La comunicazione del sapere. La questione del diritto d'autore, 
«Bollettino telematico di filosofia politica», 2007-2008, «http://bfp.sp.unipi.it/dida/f- 
pa/ar01s02.html». 

19 Ibidem. 
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2. I sistemi di comunicazione della scienza e la valutazione del sapere 


In letteratura i modelli di scambio del sapere sono molti e includono, 
in generale, diverse funzioni. John Willinsky? ne individua tre scopi 
principali, vale a dire: 

1. lo sviluppo di conoscenze innovative; 

2. la valutazione della qualità e la discriminazione tra sapere valido ed 
eccellente e conoscenze false e ininfluenti, e infine 

3. la disseminazione e l'effettiva efficacia delle conoscenze proposte al 
pubblico. 

Van de Sompel e altri ripropongono un modello presentato da Rosen- 
daal e Geurts”, basato su cinque momenti fondamentali: 


la registrazione, che permette l'esercizio di diritti di precedenza su 
una scoperta scientifica; la certificazione, che stabilisce la validità di 
una scoperta una volta registrata; la presa di coscienza, che consente 
agli attori del sistema scientifico di prendere coscienza di nuovi titoli 
e scoperte; l'archiviazione, che ne garantisce la registrazione nel tem- 
po; e infine la ricompensa, che premia gli attori per la loro prestazione 
nel sistema di comunicazione sulla base di metriche che derivano dal 
sistema stesso”. 


A] centro di ciascuno di essi si trovano le pubblicazioni, nella forma 
di articoli su periodici o di monografie. Metro di valutazione universale 
del valore scientifico, riconosciuto sul piano nazionale e in campo inter- 
nazionale, la pubblicazione dei risultati scientifici è diventata nel corso 
dei secoli un elemento cardine della comunicazione scientifica, in cui le 
riviste hanno assunto un ruolo predominante. John Ziman definisce «co- 
municazione scientifica primaria» ogni contributo originale dato alla co- 
noscenza, pubblicato normalmente nella forma di saggio o di articolo su 
una rivista dedicata a una specifica disciplina”. In parallelo alla specializ- 
zazione disciplinare, un numero sempre crescente di periodici ha visto la 
luce”. Inoltre, le pubblicazioni sono da sempre legate al problema della 


20 J. Willinsky, Proposing a Knowledge Exchange Model for Scholarly Publishing, 
«Current Issues in Education», 3, 6, 2000, pp. 1-6. 

21 H. Roosendaal, P. Geurts, Forces and Functions in Scientific Communication: an 
Analysis of their Interplay, «Cooperative Research Information Systems in Physics», 
1997, <http://www.physik.uni-oldenburg.de/conferences/crisp97/roosendaal.html>. 

22 H. Van de Sompel, S. Payette, J. Erickson, C. Lagoze, S. Warner, Rethinking 
Scholarly Communication: Building the System that Scholars Deserve, «D-Lib Magazi- 
ne», 10, 9, 2004, <http://www.dlib.org/dlib/september04/vandesompel/09vandesom- 
pel.html>. 

23 J. Ziman, Il lavoro dello scienziato: gli aspetti filosofici e sociali della scienza e 
della tecnologia, Laterza, Roma-Bari 1987 (ed. orig. 1984), p. 80. 

24 Circa un centinaio fino al 1800, un migliaio cinquant'anni dopo, 10.000 intor- 
no al 1900, nel 1965 D.J. De Solla Price ne stima circa 35.000. Cfr. S. Sacchi, Comuni- 
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valutazione, un momento fondamentale che interessa il pubblico (in ter- 
mini di ricaduta in investimenti pubblici, di linee di sviluppo, di sosteni- 
bilità della ricerca), finanziatori e investitori pubblici e privati, università 
e centri di ricerca e singoli ricercatori (in quanto determinante per l'ac- 
cesso all'accademia e per fare carriera al suo interno). 

Il problema della valutazione nell'università chiama in causa diversi 
aspetti: si valutano la ricerca e la didattica, e si valutano tanto i singoli 
quanto le istituzioni. La valutazione dei risultati avviene inoltre su un 
piano tanto nazionale quanto internazionale (si pensi, ad esempio, all'at- 
tribuzione di fondi di ricerca su base europea, uno strumento sempre più 
utilizzato per finanziare la ricerca di eccellenza dei singoli stati). 

Infine, la valutazione della scienza avviene secondo criteri di natura 
diversa: qualitativi, primo tra tutti il peer review, e, più di recente, quanti- 
tativi. Si tratta di criteri che vengono applicati in modo differente nelle 
diverse discipline e che solitamente vengono ricondotti a due macro-aree 
disciplinari, scienze, tecnologia e medicina (STM) da una parte, e dall'al- 
tra scienze umane e sociali (SSH). Nelle prime, gli articoli su rivista sono 
il principale strumento di accreditamento di uno studioso, nelle seconde 
sono invece le monografie a giocare un ruolo predominante. Nonostante 
l'efficacia di tale suddivisione, esistono al suo interno vere e proprie isole 
disciplinari in cui vigono meccanismi diversi. A titolo di esempio si con- 
sideri che la filologia classica e l'economia, che appartengono entrambe 
alle SSH, si basano su sistemi di pubblicazione e di valutazione più di- 
stanti di quanto non valga per la stessa economia e le scienze biomedi- 
che. Si deve inoltre osservare in generale che, mentre il sistema delle 
pubblicazioni nelle STM è stato analizzato e studiato”, il mercato delle 
pubblicazioni nelle SSH resta per lo più un campo oscuro, non esistendo 
nessuno studio comparabile a quelli disponibili per le discipline più ric- 
che e maggiormente finanziate. Tuttavia, al di là dei tratti specifici delle 
diverse discipline, la scienza è fatta di attività comuni (che vanno dal 
ruolo e dalla posizione in istituzioni nazionali e internazionali, al con- 
trollo delle pubblicazioni, alla capacità di ottenere finanziamenti, posti e 


cazione scientifica e open access. Problematiche sociali e tecnologiche nellapplicazione 
in Italia, tesi di laurea, 2003-04, <http://dspaceunipr.cilea.it/bitstream/1889/359/2/ 
comunicazione_scientifica_e_open_access_simone_sacchi.pdf>. 

25 Cfr. OECD, Report on scientific publishing of 2004-2005, DSTI/ICCP/IE(2004) 
11/FINAL,<http://www.oecd.org/dataoecd/42/12/35393145.pdf>; M. Dewatripont et 
al., Study on the Economic and Technical Evolution of the Scientific Publication Mar- 
kets in Europe, Directorate - General for Research, European Commission, 2006, 
<http://ec.europa.eu/research/science-society/pdf/scientific-publication-study_en.p- 
db. 

26 Per le SSH manca ad esempio uno studio comparabile a quelli citati nella nota 
precedente. Fa eccezione un recentissimo articolo di Maria Cassella, che offre dati e 
spunti interessanti. Cfr. M. Cassella, La valutazione della ricerca nelle scienze umane, 
«quaderni CNBA», 11, 2009. 
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promozioni) in cui gli scienziati competono per un monopolio sull'auto- 
rità scientifica. Di contro, l'autorità scientifica è costruita tanto come ca- 
pacità tecnica (vale a dire scientifica) quanto come potere sociale, in cui 
l'accesso alle pubblicazioni e il controllo su di esse sono parte essenzia- 
le?7. 

La natura competitiva della scienza è data per assunta da molti, ma la 
sua evoluzione in ciò che oggi è sempre più spesso definita come una 
struttura di potere oligarchica? è poco presente nel dibattito, e non viene 
messa in questione. Per discuterne i fondamenti, un'analisi del sistema di 
comunicazione e delle modalità di valutazione risulta pertanto essenzia- 
le. 

Si é accennato al fatto che la valutazione avviene secondo criteri qua- 
litativi e quantitativi, la cui scelta influenza efficacia e credibilità dei ri- 
sultati del processo. 

Nel sistema tradizionale di comunicazione scientifica, fanno parte dei 
primi il peer review, che é antecedente alla pubblicazione, e le recensioni, 
ad essa successive. Si é osservato come, sin dalle origini, il valore scienti- 
fico si costruisse tramite il giudizio di pari e la Royal Society regolasse il 
proprio privilegio con la norma secondo cui nessun libro poteva ottenere 
una licenza se non fosse stato prima approvato da almeno due membri 
del suo consiglio, per assicurare che esso non fosse contrario ai progetti e 
alle opere della società. Lungi dal rappresentare un concetto giuridico, il 
peer review è divenuto cosi il filtro per ammettere nuovi membri all'in- 
terno della società delle lettere ma anche per decidere quali opere pub- 
blicare. Il peer review, nato nel mondo del privilegio e delle accademie, 
nasce dunque come una garanzia di qualità che é strettamente connessa 
alla tecnologia della stampa. Garantendo una scienza di qualità, esso ser- 
ve a preservare il contratto tra la comunità scientifica e il potere politico, 
non senza compromessi. Nelle SSH il peer review resta, ad oggi, il princi- 
pale modo di valutazione. Ciononostante si tratta di un metodo soggetti- 
vo che, in quanto tale, è considerato da più parti discrezionale. 

Dall'inizio del diciannovesimo secolo «é andata costituendosi un'este- 
sissima letteratura secondaria, formata da bibliografie, periodici di 'rias- 
sunti', compilazioni di dati, recensioni e altre pubblicazioni regolari, che 
catalogano o passano in rassegna i contenuti della letteratura primaria», 
strumenti che, nel corso del Novecento, sono stati computerizzati?. Per 
rispondere alle esigenze di documentaristi e bibliotecari, che si trovavano 


27 Cfr. P. Bourdieu, La spécificité du champ scientifique et les conditions sociales du 
progrés de la raison, «Sociologie et sociétés», 7, 1, 1975, pp. 91-118 e J.-C. Guédon, 
Open Access. Contro gli oligopoli nel sapere (a cura di E. Di Donato), ETS, Pisa 2009. 

28 B. Whitworth, R. Friedman, Reinventing Academic Publishing online. PART I. 
Rigor, Relevance and Practice, «First Monday», 14, 8, 2009, <http://firstmonday.org/ht- 
bin/cgiwrap/bin/ojs/index.php/fm/article/view/2609/2248>. 

29J. Ziman, Il lavoro dello scienziato, cit., p. 81. 
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a fronteggiare la necessità di disporre dei periodici scientifici di ogni di- 
sciplina, a partire dal primo dopoguerra è nata la bibliometria, una 
scienza che «utilizza tecniche matematiche e statistiche per analizzare i 
modelli di distribuzione dell'informazione», il cui «successo è dovuto alla 
ricerca, da parte della comunità scientifica mondiale, di parametri ogget- 
tivi per la misurazione, detti indicatori bibliometrici, e la conseguente 
valutazione, della scienza e degli scienziati». Si tratta di criteri quantita- 
tivi ex post, vale a dire indici che servono a calcolare l'impatto di una 
pubblicazione sulle successive e a stabilire quali riviste siano da conside- 
rare irrinunciabili. Nell'adozione di questi sistemi, la crisi del '29 ha se- 
gnato uno spartiacque decisivo. 


Negli anni Trenta gli ambienti di ricerca furono fortemente riformati 
per far fronte al crollo verticale dell'economia americana e le bibliote- 
che, che fino ad allora avevano avuto un budget sufficiente a coprire 
lo sviluppo delle collezioni, e in particolare gli abbonamenti ai perio- 
dici scientifici, si sono ritrovate nell'impossibilità di fornire un servi- 
zio adeguato alle sempre crescenti richieste d'informazione. 


La contrazione dei bilanci, e l'aumento esponenziale del numero di 
testate, hanno portato alla nascita di strumenti per selezionare le pubbli- 
cazioni cosiddette fondamentali. Agli anni '30 risale la legge di Bradford 
che, come il principio di Pareto noto anche come legge 80/20, ha mostra- 
to come alcune riviste (divise per disciplina) sembrino essere in grado di 
produrre più articoli interessanti rispetto ad altre, portando all'indivi- 
duazione di “core journals, riviste che sono definite fondamentali in 
quanto considerate le migliori fonti di informazione in un campo di ri- 
cerca determinato. Uno strumento essenziale al fine di individuare la 
cosiddetta scienza fondamentale sono le citazioni; la scienza, in quanto 
attività cumulativa e progressiva, è il prodotto dell'interconnessione di 
opere recenti con opere precedenti. 


Questo fatto è in accordo con la nostra comprensione filosofica della 
conoscenza scientifica nella forma di una rete strettamente intercon- 
nessa di fatti e concetti e con la nostra osservazione sociologica che 
gli scienziati appartengono a una comunità fortemente interattiva. Il 


30 A. De Robbio, Analisi citazionale e indicatori bibliometrici nel modello Open 
Access, «Bollettino AIB», 47, 3, 2007, pp. 257-288, <http://eprints.rclis.org/11999/>. 

31 Sui limiti di tali indici, si veda OECD, The measurement of scientific and techni- 
cal activities: R&D statistics and output measurement in the higher education sector, 
Paris, 1990. 

32 S. Sacchi, Comunicazione scientifica e open access. Problematiche sociali e tecno- 
logiche nellapplicazione in Italia, cit., p. 20. 

33 S.C. Bradford, Sources of Information on Specific Subjects, «Engineering: An Il- 
lustrated Weekly Journal», 137, 1934, pp. 85-86. 
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sistema di comunicazione formale della scienza rende del tutto evi- 
denti queste interconnessioni e interazioni™. 


Tuttavia, il campo creato dalla rete di citazioni non ha una natura 
uniforme. Osservava infatti Derek J. De Solla Price in uno studio del 
1965 che, se le citazioni indicano la natura di un campo scientifico, sul 
campione studiato da Price si poteva osservare che il 35% degli articoli 
non veniva mai citato, il 49% aveva ricevuto una sola citazione, il 16% 
aveva circa 3 citazioni mentre solo l'1% ne aveva ricevute più di sei. 
«Sono tentato di concludere, scriveva infine, che delle 35.000 riviste cor- 
renti una frazione molto ampia dev'essere considerata un mero rumore 
di sottofondo, molto distante dall'essere centrale o strategico in ognuna 
delle strisce di cui è fatto l'abito della scienza»*. 

Nel tradurre tali principi in strumenti di valutazione, si è rivelato de- 
cisivo l'apporto di Eugene Garfield, che ha trasformato la legge di distri- 
buzione di Bradford nella sua legge di concentrazione creando un indice 
delle citazioni scientifiche, lo Science Citation Index (SCI), che potesse 
essere considerato una buona rappresentazione di “core science”. Lo SCI 
fu ideato nei primi anni Cinquanta da Garfield in risposta all'esigenza di 
poter disporre di un sistema bibliografico per la letteratura scientifica in 
grado di rendere ininfluenti le citazioni non rilevanti (di dati falsi, in- 
completi e obsoleti). Uno strumento finalizzato a permettere alle biblio- 
teche di scegliere la letteratura di rilievo, ai fini delle loro politiche di ac- 
quisto; e pensato perché i ricercatori potessero costruire facilmente bi- 
bliografie pertinenti e complete. Non potendo leggere tutto, chi fa ricerca 
deve poter disporre di criteri di qualità sui quali basarsi: lo scopo di un 
indice delle citazioni scientifiche sarebbe stato quello di rendere possibile 
al ricercatore la selezione delle citazioni importanti e degli articoli fonda- 
mentali per la sua ricerca. Sostenendo l'importanza di identificare stru- 
menti in grado di rendere più semplice il compito degli storici, per i qua- 
li, al crescere della quantità della letteratura scientifica «diviene sempre 
più difficile separare il grano dal loglio»**, Garfield pone così al centro 
della riflessione due elementi essenziali: l’importanza delle citazioni; e il 
problema della selezione dell’informazione scientifica. 

Perché un indice basato sulle citazioni? «Se uno considera i libri le 
macro-unità del pensiero, e gli articoli di rivista le micro-unità, l'indice 
delle citazioni si concentra sulle sub-micro-unità (molecolari) del pen- 


34 J. Ziman, Il lavoro dello scienziato, cit. p. 83. 

35 D.J. De Solla Price, Networks of Scientific Papers. The pattern of bibliographic 
references indicates the nature of the scientific research front, «Science», 194, 3683, 
1965, pp. 510-15, <http://www garfield library.upenn.edu/papers/pricenetwork- 
s1965.pdf>. 

36 E. Garfield, I.H. Sher, Richard J. Torpie, The use of citation data in writing the 
history of science, 1964, <http://www.garfield.library.upenn.edu/papers/useofcitdata- 
writinghistofsci.pdf>. 
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siero», scriveva Garfield. Gli scienziati, spesso, sono interessati a un'idea 
particolare piuttosto che a una concezione generale, e se appropriata- 
mente pensati e sviluppati, indici di “pensieri” possono essere estrema- 
mente utili ai fini della selezione dell’informazione: nel processo della ri- 
cerca bibliografica, gli indici per soggetto ricoprono un ruolo minimo, 
anche se significativo, poiché servono semplicemente da punto di par- 
tenza della ricerca. I limiti di questo mezzo, secondo Garfield, sono da ri- 
scontrarsi nel fatto che è impossibile creare indici per soggetto che co- 
prano tutte le possibili impostazioni di cui lo scienziato ha bisogno. Gli 
indici a soggetto sono schematici, e la possibilità di incrementare il nu- 
mero dei soggetti non elimina la rigidità del mezzo; perciò, neppure una 
migliore standardizzazione della classificazione sarebbe stata risolutiva. 
Viceversa, Garfield riscontrò la necessità di nuovi strumenti bibliografici 
che aiutassero a colmare la distanza tra chi crea il documento, cioè l'auto- 
re, e lo scienziato che cerca l'informazione. 

Senza nasconderne gli aspetti problematici”, l'indice delle citazioni 
viene così descritto come un indice «basato sull'associazione delle idee», 
in grado di offrire al lettore tutta la libertà d’azione che richiede, renden- 
do possibile tradurre in pratica un metodo di ricerca modellato sul sog- 
getto. Garfield fece riferimento ad alcuni esempi di indici che funziona- 
vano, già dalla prima metà dell'Ottocento, grazie a sistemi analoghi, e 
propose di sviluppare un codice di citazioni per la scienza, in cui a ogni 
articolo fosse associata una doppia serie di numeri, la prima corrispon- 
dente alla rivista in cui è stato pubblicato, la seconda scelta arbitraria- 
mente, che identifica l'articolo stesso. 

Sotto ciascun codice numerico, *11123s-687" nell'esempio in figura 1 
della pagina che segue, vengono ordinati altri codici numerici che rap- 
presentano gli articoli che citano l’articolo in questione, accompagnati da 
un'indicazione sul tipo di fonte citante. In pratica, il sistema offre una li- 
sta completa di tutti gli articoli originali che hanno citato l'articolo in 
questione, ma limitata a un insieme di riviste chiuso: quelle che appar- 
tengono all'indice. È lo stesso Garfield a mettere in luce che l'impatto di 
un articolo si riferisce a un elenco di pubblicazioni limitato. Perché tale 
sistema funzioni è infatti necessario stendere un elenco delle pubblica- 
zioni (le riviste) e catalogarle (assegnando a ciascuna un codice, nelle- 
sempio “11123s”). 


37 «Un alto numero di citazioni riflette l'impatto, ma può anche non riflettere il 
valore intrinseco. I dati ottenuti dall'analisi delle citazioni sono sempre relativi, piut- 
tosto che assoluti». E. Garfield, Irving H. Sher, Richard J. Torpie, The use of citation 
data in writing the history of science, cit., p. 10. 
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Table 1 
Index sample based on article by Hans Selye, “General adaptation 
syndrome” [J. Clin. Endocrinol. ‘6, 117 ( 1946)] 


The code number for this journal in the World List is 11,123a; the article 
number is arbitrarily taken as 687 ; and the code number for the article is 
11123a-687. The 23 articles that cited Selye's article are listed, followed by A 
hypothetical citation index entry for Selye's article: R, review article ; A, 
abstract ; 0, original article. 

1. Williams, R. H. : Thyroid & Adrenal Interrelations, 7: 52—57 (1947). 


2. Venning, E. H. : Glycogenic Corticoids, 7: 79—101 (1947). 


3. Forbes, et al. : 17-Ketosteroids in Trauma and Disease, 7 : 264—288 
(1947). 


4. Talbot, et al. : Excretion of 11-Oxy-corticosteroids, 7: 331—350 (1947). 


5. Castillo, E. B. del, et a!. : Syndrome of Rudimentary Ovaries, 7 : 385—422 
(1947). 


6. Forsham, P. H., et al. : Pituitary Adrenocorticotropin, 8 : 15—66 (1948). 
7. Pincus, G., et al : Rhythm in Biped Excretion, 8: 221—226 (1948). 
[...] 


Figura 1. Un esempio di sistema di codifica di un articolo? 


Lesempio nella figura seguente mostra lelenco delle citazioni di un 
articolo, e indica le fonti citanti. 


Citation Index Entry 
11123s-687 


464-9789(R) 
869-3366(R) 
1105-9876(A) 
1123-4432(R) 
a11,123-0752(0) 

-0779(0) 

-7264(0) 

-7331(0) 

-7385(0) 

-0866(0) 

-8221(0) 

-9158(0) 

-9497(0) 

-9529(0) 


Figura 2. Una voce dello SCI 


38 Nella figura l'elenco delle fonti citanti si limita a sette voci; per lelenco completo e 
una descrizione dettagliata del meccanismo, si veda: E. Garfield, Citation Indexes for 
Science. A New Dimension in Documentation through Association of Ideas, «Science», 
122, 3159, 1955, pp. 108-11 («Essays of an Information Scientist», 6, 1983, pp. 468- 
471),<http://www.garfield.library.upenn.edu/essays/v7p525y1984.pdf>. 
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Nel medesimo articolo Garfield suggeriva possibili impieghi pratici di 
un simile indice, che si sarebbe rivelato in particolare molto utile nelle 
scienze umane, filosofiche e sociali, per tracciare percorsi che ricostruis- 
sero l'origine e l'evoluzione di un'idea e nelle ricerche storiche al fine di 
valutare il significato di un'opera calcolando il suo impatto sulla letteratu- 
ra e sul pensiero successivi. Garfield aggiungeva che un tale fattore d'im- 
patto (Impact Factor) avrebbe potuto rivelarsi uno strumento di valuta- 
zione più indicativo e significativo rispetto al conteggio assoluto del nu- 
mero delle pubblicazioni scientifiche. Infine, l'indice delle citazioni 
avrebbe facilitato la comunicazione tra scienziati e la nascita e lo svilup- 
po di nuove idee. 

Garfield si poneva il problema di gestire grandi quantità di dati, e 
propose di applicare il proprio sistema a un numero ristretto di riviste, 
poi denominate core journals, cioè le riviste più importanti e prestigiose. 
Il sistema abbracciava, dalla sua ideazione, un'impostazione centralizzata 
dell controllo bibliografico - e se i limiti di tale impostazione sono con- 
naturati al mondo della stampa, e un'impostazione distribuita poteva 
suonare impensabile a causa della limitatezza dei mezzi a disposizione 
(in primo luogo dall'assenza della rete), questi limiti hanno avuto riscon- 
tri negativi di portata ampia. 

Lo SCI, «da sistema per risolvere al meglio un problema organizzati- 
vo all'interno delle biblioteche (la possibilità di individuare con certezza 
quali periodici acquistare, in base al loro reale utilizzo) divenne un siste- 
ma di valutazione della scienza nel suo complesso», soprattutto grazie 
all'adozione delľ Impact Factor (IF), una forma di misura standardizzata 
introdotta dall'Institute of Scientific Information (ISI) che si calcola divi- 
dendo il numero di citazioni che una rivista riceve, in un dato anno, rela- 
tive agli articoli pubblicati nei due anni precedenti, per il numero di arti- 
coli pubblicati in quegli stessi anni. Ad esempio, il fattore d'impatto di 
una rivista per il 2008 è il numero di citazioni ricevute nel 2008 relative 
agli articoli pubblicati nel 2007 e nel 2006, diviso per il numero di artico- 
li pubblicati nel 2007 e nel 2006”. 

È stato osservato che l'uso dell'Impact Factor «per la valutazione della 
ricerca scientifica individuale o collettiva, ad esempio, di dipartimenti o 
gruppi di ricercatori, o paesi interi, ha costi altissimi in termini dei danni 
che può recare al sistema scientifico e pochissimi, incerti, benefici». 


39 S. Sacchi, Comunicazione scientifica e open access. Problematiche sociali e tecno- 
logiche nellapplicazione in Italia, cit., p. 23. 

40 Cfr M. Amin, M. Mabe, Impact Factors: Use and Abuse, «Perspectives in Publi- 
shing», 1, 2000, pp. 1-6, <http://www.elsevier.com/homepage/about/ita/editors/ 
perspectivesl.pdf>. 

41 A. Figà-Talamanca, L'Impact Factor nella valutazione della ricerca e nello svi- 
luppo dell'editoria scientifica, IV seminario sistema informativo nazionale per la mate- 
matica 2000: un modello di sistema informativo nazionale per aree disciplinari, Lec- 
ce, 2000, <http://siba2.unile.it/sinm/4sinm/interventi/fig-talam.htm>. 
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Contare le citazioni di una rivista non può essere considerato un criterio 
per valutare la qualità di un articolo. Inoltre, come osserva Alessandro 
Figà-Talamanca 


altro è che un lavoro sia citato con una frase del tipo: “Il presente la- 
voro si basa sul lavoro fondamentale e pionieristico di Tizio”. Altro 
che invece sia citato con una frase che dice: “I risultati su questo pro- 
blema ottenuti da Caio non sono affidabili perché basati su unerrata 
metodologia”. Altro ancora è che Sempronio appaia citato tra decine 
di altri autori come uno dei tanti ricercatori che hanno studiato lo 
stesso problema. Nel primo e nel secondo caso naturalmente non si 
può nemmeno prendere per oro colato il giudizio di chi cita il lavoro. 
Nel terzo caso (che è quello ormai prevalente) l'informazione fornita 
dalla citazione, in merito al lavoro citato, è pressoché nulla. In molti 
casi non si può nemmeno dire che chi cita abbia letto l'articolo citato, 
meno che mai che ne sia stato influenzato. Parlare di “impatto” sulla 
ricerca scientifica dei risultati del lavoro citato è, in questo caso, del 
tutto arbitrario”. 


Gli effetti negativi dell'applicazione del fattore d'impatto sono molte- 
plici, primo tra tutti il fatto che scelte dei criteri di valutazione arbitrarie 
si mascherano di obiettività. Se infatti una citazione è in grado di aumen- 
tare l'IF i ricercatori cercano di pubblicare in riviste ad alto IF citando, a 
questo scopo, la rivista in cui vorrebbero vedere pubblicati i propri arti- 
coli. Una pratica richiesta dagli stessi comitati di redazione delle riviste 
“prestigiose” e accettata dagli autori in quanto utile ad aumentare il pro- 
prio valore sul mercato accademico. Ma è possibile rendere obiettiva la 
valutazione? Una risposta è quella indicata da Figà-Talamanca, che scri- 
ve: 


Una valutazione discrezionale è obiettiva nella misura in cui non è 
dettata da interessi diretti o indiretti di chi valuta, cioè nella misura in 
cui si esprime un giudizio "imparziale". Nessuno è in grado a priori di 
assicurare questa imparzialità. Ma certamente uno degli strumenti 
per controllare i giudizi scientifici è quello della censura, in termini di 
reputazione, che può esercitare una comunità scientifica vigile e aper- 
ta. Una condizione necessaria perché questa censura possa essere 
esercitata è che ci sia una chiara attribuzione di responsabilità. Un 
giudizio basato su scelte discrezionali oscurate da presunti parametri 
oggettivi è sottratto ad ogni critica e quindi potenzialmente arbitra- 
rio. Queste considerazioni si applicano non solo quando si tratta di 
giudicare i singoli, ma anche quando il giudizio si applica a gruppi o 
strutture in competizione?. 


42 Ivi. 
43 Ivi. 
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3. La crisi del sistema tradizionale e le trasformazioni in atto 


In un lavoro recente, Whitworth e Friedman hanno definito il sistema 
tradizionale di pubblicazione in campo scientifico un sistema feudale 
perché esclusivo, datato (poco aggiornato), conservatore (in quanto resi- 
stente ai cambiamenti e all'innovazione), e i cui contenuti sono poco letti 
o discussi e spesso inaccessibili e molto specialistici“. Non si tratta di un 
giudizio di valore, ma di un'analisi che mette in luce alcuni limiti di tale 
sistema, e che merita qualche approfondimento. 

Di proprietà dello Institute for Scientific Information, un'azienda pri- 
vata che dal 1992 appartiene a quella che oggi è la Thomson Reuters Cor- 
poration, vero e proprio gigante editoriale, lo SCI pone infatti un proble- 
ma di democraticità nell'accesso all'informazione. 


È importante avere ben presente questo fatto perché l'azienda, dall'al- 
to della sua posizione dominante sul mercato, come detentrice di una 
formidabile base di dati sulle pubblicazioni e citazioni scientifiche, ha 
preso, come tutte le aziende, numerose decisioni dettate da interessi 
venali e basate su calcoli dei costi e dei benefici marginali.*5 


Laccentramento dell'indice ha così creato profonde distorsioni nel- 
l'organizzazione della comunicazione scientifica. Riguardando un nume- 
ro limitato di riviste fondamentali, l'indice delle citazioni e il fattore 
d'impatto si sono rivelati efficaci strumenti di controllo capaci di attri- 
buire molto potere a un ristretto numero di editori. L'adozione dello SCI 
come metro attraverso cui valutare la ricerca ha inoltre ridotto la possibi- 
lità di trovare informazioni al di fuori del nucleo fondamentale delle rivi- 
ste SCI, limitando l’impatto di un sistema basato sulle associazioni; se la 
ricerca si nutre spesso di annotazioni secondarie e segue piste parzial- 
mente esplorate, l'esclusione di intere aree della conoscenza umana dal- 
l'indice ha creato una “scienza di serie A" e una “scienza di serie B”, ren- 
dendo l'accesso alla seconda pressoché impossibile. In altre parole, è ISI- 
SCI a stabilire i termini della valutazione e a fornire poi gli strumenti per 
analizzare le attività scientifiche. Il modello corrente di gate-keeping ge- 
stito da Thomson Reuter appare inoltre poco efficiente nel momento in 
cui il sapere si espande - e il sistema di pubblicazione accademica do- 
vrebbe cercare di essere inclusivo e democratico piuttosto che esclusivo e 
plutocratico. 

Se le pubblicazioni scientifiche su carta hanno rappresentato fino a 
tempi piuttosto recenti l'unico mezzo per diffondere l'informazione 
scientifica e riconoscerne la scientificità attraverso il filtro del peer review, 


44 B. Whitworth, R. Friedman, Reinventing Academic Publishing online. PART I. 
Rigor, Relevance and Practice, cit. 

45 A. Figà-Talamanca, L'Impact Factor nella valutazione della ricerca e nello svi- 
luppo dell'editoria scientifica, cit. 
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alle riviste è stato in tal senso accordato un ruolo fondamentale, soprat- 
tutto nelle STM. Abbiamo osservato come il prestigio di queste ultime sia 
legato alla loro presenza nel catalogo SCI. Si osservi inoltre che se fino 
alla prima metà del secolo scorso la pubblicazione scientifica non era 
redditizia, l'affermazione del catalogo ISI ha trasformato questa situazio- 
ne producendo un nucleo di core journals che le biblioteche scientifiche 
dovevano avere a qualsiasi costo. 

Si intuisce facilmente come il catalogo, nato in origine per scopi bi- 
bliografici, abbia finito per contribuire a produrre politiche dei prezzi di 
tipo monopolistico tipiche di un mercato anelastico, con pesanti conse- 
guenze: proprio a causa del loro ruolo decisivo nella valutazione del fat- 
tore d'impatto, le biblioteche universitarie non possono non abbonarsi 
alle riviste ISI-SCI, quale che sia il costo di tali abbonamenti. La scarsa 
elasticità della domanda e il carattere oligopolistico delle multinazionali 
dell'editoria scientifica hanno reso possibile un aumento sproporzionato 
dei prezzi di abbonamento delle riviste. 

Gli esiti di questa situazione sono conosciuti tra i bibliotecari come 
“crisi dei prezzi dei periodici”, espressione tramite la quale si definisce 
l'aumento del prezzo delle riviste che, tra 1975 e il 1995, è cresciuto del 
300% oltre l'inflazione‘. Tale fenomeno produce gravi conseguenze sia 
sulla politica di abbonamenti alle riviste non incluse nel catalogo SCI, sia 
sull'acquisto delle monografie, che restano il veicolo principale della 
pubblicazione umanistica, acquisto che viene sacrificato a favore degli 
abbonamenti alle riviste. 

Un ulteriore effetto di tale politica editoriale e scientifica è stata il 
progressivo rafforzamento della gerarchia a due livelli tra riviste di serie 
A e riviste di serie B, che ha reso più duri gli effetti dei principi di inclu- 
sione/esclusione già all'opera nella creazione delle prime bibliografie. 

Infine, a causa dei requisiti imposti dai grandi editori oligopolisti nel 
settore, tra cui oltre a Thomson Reuters Corporation è opportuno ricor- 
dare Reed Elsevier e Springer - Kluwer Academic Publishing, i core jour- 
nals coincidono con pubblicazioni in lingua inglese. Ciò ha portato alla 
definizione di un sistema anglo-centrico, in cui pubblicare in lingue di- 
verse dall'inglese costituisce di per se un fattore discriminante. 

L'avvento di Internet e del Web ha in parte cambiato la situazione, so- 
stituendo agli indici bibliometrici i cosiddetti indici webometrici, che 
computano le citazioni su basi di dati online”. Se SCI ha creato rapida- 


46 Dati OCSE. Cfr. OECD, Report on scientific publishing of 2004-2005, cit. 


47 L'analisi webometrica è nata sulla scia della bibliometria per misurare la produ- 
zione scientifica che viene disseminata tramite il Web. L'espressione “webometrics” è 
stata in particolare coniata nel 1997 da Almind e Ingwersen (T.C. Almind, Peter Ing- 
wersen, Infometric analyses on the World Wide Web: Methodological approaches to 
'webometrics', «Journal of Documentation», 53, 4, 1997, pp. 404-426). Cfr. la voce 
Webometrics di wikipedia <http://en.wikipedia.org/wiki/Webometrics>. Cfr. anche 
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mente la sua versione digitale a pagamento (nota come Web of Science), 
un altro gigante dell'editoria, Reed Elsievier propone oggi Scopus, un da- 
tabase sviluppato quale concorrente diretto di SCI con l’obiettivo di pren- 
dere il posto attualmente occupato sul mercato dallo Science Citation In- 
dex. Questo obiettivo è stato perseguito attraverso due strategie principa- 
li: 1) la sostituzione dell Impact Factor con lo h-index**, un indice svilup- 
pato nel 2005 da Jorge E. Hirsch che, a differenza del primo, si basa sul 
numero delle pubblicazioni ed il numero di citazioni ricevute da un ri- 
cercatore, permettendo così di quantificare la prolificità e l'impatto del 
lavoro di un singolo scienziato indipendentemente dall'etichetta della ri- 
vista; 2) una maggiore copertura delle pubblicazioni, non più confinata 
alle sole riviste in lingua inglese, che arriva a comprendere non solo le ri- 
viste tradizionali (oggi quelle presenti nella banca dati sono oltre 17.000), 
ma anche riviste open access? (circa 1200) e diversi altri tipi di prodotti 
editoriali tra cui atti di conferenze, pubblicazioni commerciali di diversa 
natura, collane di libri. Una soluzione che appare appetibile, come mo- 
stra la decisione, resa nota nel settembre del 2009, di acquisire i dati di 
Scopus per il Comitato di Indirizzo per la Valutazione della Ricerca 
(CIVR). 

Tuttavia, i criteri per essere inclusi nel data base restano oscuri e di- 
scutibili. È ad esempio richiesto che la pubblicazione sulle riviste avven- 
ga con scadenze regolari, criterio che, oltre non avere alcuna utilità sulle 
riviste digitali, che non sono sottoposte ai medesimi vincoli della stampa, 
in Italia taglia fuori i periodici pubblicati da società e associazioni scien- 
tifiche, che non abbiano un giornalista iscritto all'albo come direttore. La 
sfida capitanata da Reed-Elsevier non mette in discussione la divisione 
creata da SCI, ma si limita a cercare di volgerla a suo vantaggio, come di- 
mostra la lista delle istituzioni che sono state coinvolte nella progettazio- 
ne della base di dati, quasi solo europee e Nordamericane*. Certamente, 
la nascita di ulteriori indici come il Chinese Science Citation Database, 
che nel 2001 copriva 991 titoli, solo 31 dei quali presenti su SCI, e di in- 
dici analoghi validi per paesi e continenti cosiddetti periferici può modi- 
ficare questa situazione. 

Ma ad entrare nella scena sono stati anche altri attori non tradiziona- 
li, tra i quali è utile ricordare Google con il progetto Google Scholar? 


EU TSER project PL97-1296 The self-organization of the European Information Socie- 
ty (SOEIS), 1997-99, <http://utopia.duth.gr/-mboudour/soeis/>. 

48 Cfr. J.E. Hirsch, An index to quantify an individuals scientific research output, 
2005, <http://arxiv.org/abs/physics/0508025>. E possibile calcolare l'indice h anche 
sull'intero Web, per esempio tramite software come Publish or Perish, scaricabile al- 
l'URL <http://www.harzing.com/pop.htm>. 

49 Sono riviste gratuite online, compatibili con il protocollo OAI-PMH. Si veda il 
capitolo 4. 

50 J.C. Guédon, Open Access. Contro gli oligopoli nel sapere, cit., pp. 77-8. 


32 LA SCIENZA E LA RETE 


Luso della banca dati di Google Scholar? è gratuito, l'inclusione delle 
fonti è aperta a biblioteche ed editori e intere biblioteche hanno scelto di 
far digitalizzare le proprie collezioni da Google; il database può essere 
utilizzato per produrre più indici; inoltre, gli algoritmi utilizzati per clas- 
sificare le pagine dal più grande motore di ricerca presente oggi sul mer- 
cato fanno riferimento all'uso mondiale della rete e non restituiscono 
un'immagine del sapere scientifico confinato al solo mondo occidentale, 
creando un terreno di competizione scientifica più equilibrato. 

Prima di analizzare nel dettaglio questa e altre possibilità oggi dispo- 
nibili grazie alle nuove tecnologie, è tuttavia opportuno considerare da 
vicino l'architettura, i principi del Web e i suoi sviluppi più recenti. Una 
tale disamina permetterà di comprenderne appieno limiti e potenzialità, 
e di esplorare possibili modelli alternativi a quelli proposti. 


51 «Google Scholar è un motore di ricerca accessibile liberamente che tramite pa- 
role chiave specifiche consente di individuare testi della cosiddetta letteratura accade- 
mica come articoli sottoposti a revisione paritaria, tesi di laurea e dottorato, libri, 
preprint, sommari, recensioni e rapporti tecnici di tutti i settori della ricerca scientifi- 
ca. Google Scholar consente di reperire articoli da una vasta gamma di case editrici 
che si rivolgono al mondo dello studio e della ricerca da associazioni scientifiche e 
professionali, depositi di preprint e università, oltre che nella galassia di articoli 
scientifici e culturali distribuiti sul Web. 

Gli articoli in esso indicizzati comprendono pure quelli pubblicati da Elsevier (il 
più grande editore scientifico a livello globale), e nella sua funzione è simile al moto- 
re di ricerca interno Scirus di Elsevier e a Citeseer. È anche molto simile a quelli a pa- 
gamento Scopus e Thomson ISI Web of Science. Google Scholar in ogni caso afferma 
di coprire più siti web, sorgenti giornalistiche e lingue di tutti gli altri». Cfr. la relati- 
va voce di Wikipedia: <http://it.wikipedia.org/wiki/Google_Scholar>. 

52 Cfr. <http://scholar.google.com> e anche la pagina <http://scholar.google.it/ 
intl/it/scholar/about.htm]>. 


CAPITOLO 2 


UN SISTEMA UNIVERSALE DI DOCUMENTAZIONE: 
IL WORLD WIDE WEB 


1. Un po' di storia 


Il progetto di un sistema universale di documentazione risale alla fine 
degli anni Ottanta del Novecento. È lo stesso inventore del Web a narrare 
le circostanze della sua nascita e a raccontare la storia della sua evoluzio- 
ne in un testo divulgativo pubblicato nel 1999 e tradotto due anni dopo 
in italiano’. 

Laureatosi in fisica nel 1976 al Queen's College di Oxford, il giovane 
scienziato inglese si impiega come programmatore alla Plessey Telecom- 
munications prima e poi alla D.G. Nash, presso cui costruisce il suo pri- 
mo computer. La sua iniziale collaborazione con il CERN risale al 1980, 
anno in cui scrive Enquire, un programma «retiforme» che anticipa una 
caratteristica essenziale del World Wide Web, la possibilita di collegare 
pezzi di informazione in forma ipertestuale. Incaricato di occuparsi dei 
sistemi informativi del laboratorio franco-svizzero che ospitava diverse 
migliaia di ricercatori delle pit differenti nazionalita (i quali lavoravano 
su numerosi progetti collegati ma indipendenti e che utilizzavano un'am- 
pia gamma di programmi e di calcolatori incapaci di comunicare tra 
loro), Berners-Lee si scontra con le difficoltà derivanti dal dover gestire 
una tale mole di informazione: «Preparai Enquire nel tempo libero, per 
utilizzo personale e al nobile scopo di aiutarmi a ricordare i rapporti in- 
tercorrenti tra le varie persone, calcolatori e progetti all'interno del labo- 
ratorio»?. E continua: 


Su Enquire potevo scrivere una pagina d'informazioni a proposito di 
una persona, una macchina o un programma. Ogni pagina era un 
"nodo" nel programma, una specie di scheda. L'unico modo per 
crearne uno nuovo era attuare un collegamento da un nodo già esi- 


1 T. Berners-Lee, L'architettura del nuovo Web, Feltrinelli, Milano 2001, scritto in 
collaborazione con Mark Fiaschetti (ed. or. 1999). Si vedano anche la documentazio- 
ne disponibile all'URL «http://www.w3.org/History/» e l'ipertesto, a cura dello stesso 
Berners-Lee <http://www.w3.org/DesignIssues>. 

2 Ivi, p. 18. 


Francesca Di Donato, La scienza e la rete : l'uso pubblico della ragione nell'età del Web, 
ISBN 978-88-8453-494-1 (print) ISBN 978-88-8453-500-9 (online) 
© 2009 Firenze University Press 
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stente. I link da e verso un nodo apparivano come un elenco numera- 
to in fondo alla pagina, un po' come la lista delle citazioni alla fine di 
una pubblicazione accademica?. 


Nella costruzione del suo organigramma, il fisico inglese scopre le 
potenzialità insite nella possibilità di inserire collegamenti in modo libe- 
ro. Non solo: al principio Berners-Lee distingue diverse tipologie di col- 
legamenti: «Per ogni link, potevo descrivere il tipo di rapporto. Per 
esempio, dichiarando se la relazione tra Joe e un programma era il fatto 
che lo usasse o che l'avesse scritto». Enquire funzionava in base a un 
principio molto semplice: bastava etichettare ogni pezzo d'informazione 
con un nome e poi ordinare al computer di trovarlo. Diventando possibi- 
le fare riferimento a ogni cosa allo stesso modo, si dava così vita a una 
rete di informazioni. Un'altra implicazione positiva stava nel fatto che i 
computer avrebbero potuto seguire e analizzare gli incerti rapporti di 
connessione che definiscono gran parte dei meccanismi sociali, rivelan- 
do modalità di vedere il mondo del tutto inedite. 

La natura e l'evoluzione del Web sono correlate in maniera inestrica- 
bile, come spiega il suo stesso autore: «L'invenzione del World Wide Web 
ha comportato la crescente comprensione da parte mia del potere insito 
nel disporre le idee in maniera reticolare, una consapevolezza che ho ap- 
punto acquisito tramite questo genere di procedura»*. Enquire lo porta a 
concepire una visione fondata sulla crescita decentrata e organica di idee, 
tecnologia e società. Alla base del sistema stava infatti l'ipotesi che i com- 
puter potessero diventare molto più potenti se posti in grado di mettere 
in connessione informazioni altrimenti scollegate. Potenzialmente, la ra- 
gnatela globale dell'informazione si presentava come un tutto collegato a 
tutto, nel quale i meccanismi sociali diventavano simili a quelli con cui 
funziona il cervello. 

La prima collaborazione al CERN dura pochi mesi. Nell'abbandonare 
il laboratorio, Berners-Lee lascia al suo successore il codice di Enquire, 
che andrà in seguito perduto. Tra il 1981 e il 1984 torna a vivere in Gran 
Bretagna, dove lavora come ingegnere informatico scrivendo software 
per stampanti. E in quel frangente che acquisisce dimestichezza con i lin- 
guaggi di mark-up, in particolare SGML’. 


3 [vi, p. 23. 

^ ]vi, pp. 16-7. 

5 Un linguaggio di mark-up descrive i meccanismi di rappresentazione di un te- 
sto. Mark-up (letteralmente: marcatura) é un termine nato in ambiente tipografico 
per segnalare in forma standardizzata le parti del testo che necessitano di una corre- 
zione. Tale tecnica richiede una serie di convenzioni, cioé un linguaggio a marcatori 
di documenti. 

HTML, al pari di SGML, é un linguaggio di mark-up di tipo descrittivo, vale a 
dire che la scelta del tipo di rappresentazione da applicare al testo è lasciata al soft- 
ware. SGML (Standard Generalized Markup Language) è stato il primo linguaggio di 
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Dall'84 riprende la collaborazione con il CERN, grazie a una borsa di 
studio che gli consente di lavorare al “controllo e acquisizione dati”, pres- 
so il gruppo incaricato al rilevamento e all'elaborazione dei dati risultanti 
dagli esperimenti dei fisici delle alte energie. Lì scrive un secondo pro- 
gramma, Tangle (che significa letteralmente intrico, groviglio). 


In Tangle, spiega ancora, se ricorreva una certa sequenza di caratteri, 
il programma creava un nodo che la rappresentasse. Quando essa ri- 
compariva, invece di ripeterla Tangle attivava un semplice rimando al 
nodo principale. Man mano che altre frasi venivano immagazzinate 
come nodi, e altri puntatori le indicavano, si formava una serie di col- 
legamenti. Il nocciolo della questione era che l'aspetto fondamentale 
sono le connessioni. Non sta nelle lettere, ma in come esse si unisco- 
no a formare parole. Non sta nelle parole, ma come si uniscono per 
formare frasi. Non sta nelle frasi, ma come si uniscono in un docu- 
mento. Immaginai di inserire in questa maniera un'enciclopedia, 
quindi porre una domanda a Tangle. La domanda sarebbe stata ridot- 
ta in tanti nodi, che poi avrebbero fatto riferimento ai punti in cui ap- 
parivano all'interno dell'enciclopedia. Il groviglio risultante avrebbe 
contenuto tutte le risposte relative”. 


Il risultato dell'esperimento è fallimentare. Berners-Lee dismette il 
programma e tuttavia non abbandona il progetto, per il cui sviluppo 
l'ambiente del CERN si rivela particolarmente fecondo: la compresenza 
di migliaia di persone, che utilizzavano un numero imprecisabile di mac- 
chine su cui giravano i programmi più disparati e comunicavano grazie a 
una moltitudine di protocolli di rete, anticipava quella diversità intercon- 
nessa che di lì a pochi anni si sarebbe ritrovata anche nel mondo esterno. 


Oltre a tener conto dei rapporti tra le varie persone, esperimenti e 
macchine, volevo facilitare l'accesso ai vari tipi di informazione, come 
gli scritti tecnici dei vari ricercatori, i manuali dei diversi moduli di 
software, i resoconti delle riunioni, gli appunti e così via. Inoltre, mi 
toccava rispondere di continuo alle medesime domande poste da tan- 
te persone distinte. Sarebbe stato molto più semplice se tutti avessero 
potuto consultare il mio database.” 


Sono probabilmente queste le ragioni per cui Berners-Lee persevera 
nella sua idea di creare un sistema di documentazione universale. 

Il successore di Tangle è Remote Procedure Call (RPC), un program- 
ma scritto per facilitare la comunicazione tra i computer e le reti. Ber- 


mark-up descrittivo standardizzato a livello internazionale e ha avuto ampio utilizzo 
nella produzione di documentazione tecnica. 

6 T. Berners-Lee, L'architettura del nuovo Web, cit., p. 26. 

7 Ivi, p. 27. 
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ners-Lee ha ben chiaro che costringere gli scienziati a riadattare il loro si- 
stema di lavoro in base alle sue necessità lo porterebbe necessariamente 
all'insuccesso. Viceversa, deve pensare a un sistema di documentazione 
che consenta a ciascuno di conservare il proprio metodo organizzativo e 
i suoi programmi. «Dovevo creare, scrive, un sistema con regole comuni, 
accettabili per tutti, cioè il più possibile vicino alla mancanza di regole»*. 
RPC assolve al compito richiesto. 

Il modello che sceglie per il sistema minimalista che ha in mente è l'i- 
pertesto. Il termine, coniato nel 1965 da Ted Nelson, indica un formato 
nuovo, non lineare, scritto e pubblicato tramite macchine cosiddette “let- 
terarie?. Con Xanadu", il progetto ipertestuale di Nelson, ogni informa- 
zione sarebbe stata pubblicata in forma ipertestuale. Ogni citazione sa- 
rebbe stata dotata di un link alla fonte, garantendo agli autori originali 
una piccola ricompensa ogni volta che la fonte venisse letta. 

Berners-Lee immagina l'ipertesto come uno strumento per il lavoro 
di gruppo e collaborativo, in cui ciascuno è in grado di scrivere e di leg- 
gere in un reticolo di documenti. Il sistema che ha in mente dovrebbe es- 
sere decentrato, in modo che ogni nodo sia intrinsecamente equivalente 
agli altri e che sia possibile collegarsi a un nodo (pagina) qualsiasi senza 
richiedere alcuna autorizzazione a un'autorità centrale. È su tale base che 
progetta un sistema in grado di combinare i link esterni con l'ipertesto e 
con gli schemi di interconnessione sviluppati per RPC. 


L'ipertesto sarebbe stato molto potente, aggiunge ancora, se fossimo 
riusciti a indirizzarlo verso il nulla più totale. Ogni nodo, documento 
o come preferite chiamarlo, sarebbe stato intrinsecamente equivalen- 
te agli altri. Tutti avrebbero posseduto un indirizzo di riferimento. Sa- 
rebbero esistiti insieme nel medesimo spazio, lo spazio dell'informa- 
zione!!. 


Una tappa fondamentale per la definizione del suo progetto è la pene- 
trazione del sistema operativo Unix e soprattutto di Internet all'interno 
del CERN. L'invenzione delle tecnologie alla base di Internet risale ai tre 
decenni precedenti ed è dovuta all'inventiva e all'intraprendenza di un 
gruppo di scienziati giovanissimi delle più prestigiose università ameri- 
cane (il MIT, la UCLA e la Stanford University) e di DARPA (Defense 
Advanced Research Projects Agency), l'agenzia governativa del Diparti- 


8 Ivi, p. 28. 

? Si vedano: T. Nelson, A File Structure for the Complex, The Changing and the In- 
determinate, «ACM 20th National Conference», pp. 84-100, 1965; Id, Literary machi- 
nes 90.1. Il progetto Xanadu, Muzzio, Padova 1992 (edd. origg. 1981, 1987, 1990 e 
1993). 

10 Si veda la relativa voce di Wikipedia <http://it.wikipedia.org/wiki/Progetto_ 
Xanadu> (10/09). 

11 T. Berners-Lee, L'architettura del nuovo Web, cit., pp. 28-29. 
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mento della Difesa degli Stati Uniti incaricata dello sviluppo di nuove 
tecnologie per uso militare. Oggetto di una ricerca congiunta e parallela, 
è il progetto di reti di calcolatori per lo scambio di documentazione e in- 
formazioni che trova spazio in una «repubblica degli informatici dipen- 
dente da contratti federali e protetta dagli influssi del mondo esterno», al 
cui «interno si forma l'idea secondo cui il modello di socialità sviluppa- 
tosi attorno e mediante Arpanet si può trasferire al mondo comune».? 

Uno strumento di comunicazione essenziale per gli scienziati che 
fanno parte della "repubblica" sono le Request For Comments (RFC), una 
serie di note inaugurata nel 1969 come strumento attraverso il quale i ri- 
cercatori si scambiano in modo rapido e informale appunti, osservazioni, 
idee, che vengono discussi, ampliati, definiti e poi messi in pratica. I gio- 
vani scienziati fanno dei principi del libero pensiero, del metodo critico e 
della condivisione e cooperazione con i loro pari, una pratica organizzata 
di lavoro. Nate all'inizio su carta, le RFC circolano poi su ARPANET e 
tra le reti tramite il protocollo File Transport Protocol (FTP) e successiva- 
mente sul Web. 

L'uso delle RFC scambiate pubblicamente è fondamentale per l'affer- 
marsi dei protocolli, tutti rigorosamente pubblici. La definizione dei pro- 
tocolli si basa infatti su una procedura fissa, fatta dei seguenti passaggi. 
La "richiesta di commenti" gira in rete e raccoglie le osservazioni degli 
altri, dei cui contributi si arricchisce. Una volta raggiunto il consenso 
della comunità sul suo contenuto, si produce un documento, in termini 
tecnici una “specifica”, che poi è usata e testata dai gruppi di ricerca 
come base su cui implementare il software e, se si afferma all'interno del- 
la comunità, diventa un protocollo. La pratica delle RFC genera un effet- 
to benefico, sia fornendo le regole della comunicazione alla comunità, sia 
ampliando il numero di coloro che collaborano alle innovazioni intro- 
dotte. Nel tempo, la produzione di RFC si é andata orientando sempre 
più sulla produzione di standard dei protocolli ( specifiche" ufficiali). 
L'accesso aperto (libero da copyright e gratuito) alle RFC favorisce la cre- 
scita di Internet perché consente alle specifiche di essere discusse, modi- 
ficate e adottate sia nelle università e nei centri di ricerca, sia nelle impre- 
se. 

Ma l'elemento determinante per la nascita di Internet, forse il pilastro 
fondamentale della sua architettura, è lo stack (letteralmente “pila”) di 
protocolli di comunicazione che si chiamerà Transmission Control Proto- 


12 A. Mattelart, Storia della società dell'informazione, Einaudi, Torino 2002 (ed. 
orig. 2001), p. 51. 

13 Col termine "specifica" in ingegneria del software si intende un accordo tra un 
produttore di servizi ed un utente. A seconda del contesto, si parla di specifiche dei 
requisiti (tra sviluppatore e committente), specifiche di progetto (tra progettista e svi- 
luppatore, come nel caso delle specifiche dei protocolli), e di specifiche di modulo 
(tra i programmatori che hanno prodotto il modulo e quelli che lo integrano). Cfr. la 
relativa voce di Wikipedia: <http://it.wikipedia.org/wiki/Specifica>. 
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col/Internet Protocol (TCP/IP) dal 1978, progettato a partire dal 1972 da 
Robert Kahn, anch'egli a DARPA. Kahn dapprima introduce in un pro- 
getto di rete radio l'idea di “open-architecture networking”, e crea un pri- 
mo programma di nome "Internetting'; di esso, lo scienziato decide poi 
di sviluppare una nuova versione che soddisfi le richieste di una rete ad 
architettura aperta, vale a dire: 

(1) che rispetti l'autonomia tecnica di ogni singola sotto-rete, senza 
comportare il bisogno di apportare modifiche per connettersi tramite il 
protocollo; 

(2) in cui la comunicazione avvenga sulla base della regola del best 
effort (migliore prestazione): un pacchetto perso viene ritrasmesso; 

(3) in cui per connettersi alla rete siano usati black boxes (gateway e 
router'^). I gateway non conservano informazioni sul passaggio dei pac- 
chetti; 

(4) che non preveda alcun controllo globale o centrale sulle operazio- 
ni. 

In pratica, il TCP viene progettato con le seguenti funzionalità: 


a) Piccole sotto-sezioni con cui l'intera rete sarebbe stata capace di 
comunicare attraverso computer specializzati il cui compito era solo 
di indirizzare i pacchetti (gateway, router, switch,... ). 

b) Nessuna parte della rete sarebbe stata singolo punto di rottura o 
sarebbe stata capace di controllare tutta la rete. 

c) Ogni pezzo dell'informazione inviata attraverso la rete avrebbe 
avuto una sequenza di numeri per assicurare che sarebbero stati in- 
viati nell'ordine giusto alla destinazione e riconoscere la loro perdita. 
d) Un computer che inviava un'informazione ad un altro avrebbe sa- 
puto se questa fosse stata ricevuta nel momento in cui il computer di 
destinazione avesse inviato uno speciale pacchetto detto acknowled- 
gement. 

e) Se l'informazione inviata da un altro computer andava persa, l'in- 
formazione veniva ritrasmessa dopo che la perdita veniva intercettata 
da un timeout che avrebbe identificato che l'atteso acknowledgement 
non era stato ricevuto. 

f) Ogni pezzo dell'informazione inviata attraverso la rete sarebbe sta- 
to accompagnato da un checksum [somma di controllo], calcolato 
dall'originale computer sorgente e verificato dalla destinazione, per 
assicurare che non fosse rovinato.!* 


14 Dispositivi di rete il cui scopo principale è quello di veicolare i pacchetti di rete 
all'esterno della rete locale (LAN). Cfr. Wikipedia all'URL <http://it.wikipedia.org/ 
wiki/Gateway> (10/09). 

15 Letteralmente “instradatore’, è un dispositivo di rete che si occupa di instrada- 
re pacchetti. Cfr. Wikipedia: <http://it.wikipedia.org/wiki/Router> (10/09). 

16 Cit. da Wikipedia, voce italiana di Robert Kahn: <http://it.wikipedia.org/wiki/ 
Robert_Kahn> (10/09). 
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Una volta definiti i principi", nella primavera del 1973 è Kahn a chie- 
dere a Vinton Cerf (al tempo alla Stanford University) di aiutarlo a scri- 
vere l'implementazione dello stack di protocolli TCP/IP", che viene adot- 
tato da ARPANET il primo gennaio 1983 e che diventa, nell'arco di circa 
dieci anni, il protocollo standard di comunicazione tra reti di computer, 
vale a dire l'insieme delle convenzioni tramite cui i computer si inviano i 
dati. 

L'ultima tappa importante nella storia di Internet che ricordiamo qui 
è l'introduzione, sempre nel 1983, del Domain Name System (DNS), un 
sistema che consente di adottare un meccanismo scalabile e distribuito 
per tradurre gerarchie di nomi di host in un indirizzo internet. Il DNS 
consente di associare numeri (indirizzi degli host) a nomi di dominio. A 
ogni dominio di nomi viene associata un'autorità di dominio. È questo 
l'unico elemento dell'architettura di Internet che implica una forma di 
centralizzazione e di accentramento. 

Le agenzie federali, negli anni a seguire, danno vita a politiche decisi- 
ve per la diffusione e lo sviluppo di Internet, dividendo e accollandosi i 
costi delle infrastrutture comuni come i circuiti transoceanici, attività 
per coordinare la quale nasce il Federal Networking Council (FNC), che 
coopera con RARE in Europa. Gli stessi inventori di Internet scrivono 
due report importanti per il suo futuro sviluppo: Toward a National Re- 
search Network! (1988) commissionato dalla National Science Founda- 
tion, rapporto essenziale nell'influenzare Al Gore nel progetto delle auto- 
strade informatiche e, nel 1994, Realizing the Information Future: The In- 
ternet and Beyond®. 

Nel 1995 il FNC emana all'unanimità la seguente definizione: 


“Internet” refers to the global information system that -- (i) is logical- 
ly linked together by a globally unique address space based on the In- 
ternet Protocol (IP) or its subsequent extensions/follow-ons; (ii) is 
able to support communications using the Transmission Control Pro- 
tocol/Internet Protocol (TCP/IP) suite or its subsequent 
extensions/follow-ons, and/or other IP-compatible protocols; and 
(iii) provides, uses or makes accessible, either publicly or privately, 
high level services layered on the communications and related infra- 
structure described herein”!. 


17 Cfr. RE. Kahn, Communications Principles for Operating Systems, «Internal 
BBN memorandum», 1972. 

18 Cfr. V.G. Cerf and R.E. Kahn, A protocol for packet network interconnection, 
«IEEE Trans. Comm. Tech.», COM-22, 5, 1974, pp. 627-641. DARPA fa tre contratti 
a Stanford (Cerf), BBN e UCL per implementare TCP/IP, dai quali hanno inizio una 
sperimentazione e uno sviluppo di lungo periodo. 

19 Online all'URL <http://www.nap.edu/openbook.php?isbn=NI000393>. 

20 Online all'URL <http://www.nap.edu/openbook.php?record_id=4755>. 
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Si osservi che in tale definizione l'unica caratteristica tecnica menzio- 
nata è la suite di protocolli (TCP/IP). In essa è inoltre essenziale il con- 
cetto di strati, sia tra i protocolli, sia di servizi di alto livello. A partire 
dallo stack di protocolli TCP/IP, Internet si fonda dunque sul concetto di 
architettura multi-livello, come si vede nelle immagini che seguono. 


OSI Model 
data unit layers 
: data application 
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Figura 1. Riproduzione del modello Operating System Infrastructure (standard 
stabilito nel 1978 dall'International Organization for Standardization che sta- 
bilisce una pila di protocolli in 7 livelli) e “pila” dei protocolli TCP/IP. 


Il concetto di architettura a strati (layered network) è essenziale in 
un'architettura aperta in quanto consente di introdurre innovazioni sen- 
za dover apportare cambiamenti nell'architettura della rete. Il Web, ad 
esempio, si trova al livello delle applicazioni (vedi figura sopra, a destra, 
il protocollo HTTP), e ha potuto diffondersi sopra e grazie a Internet 
senza richiedere alcuna modifica alla rete sottostante. 

L'architettura di Internet dunque è decentrata, distribuita e prevede 
una sovrabbondanza di funzioni nel network per minimizzare il rischio 
di sconnessione. Essa è inoltre aperta in quanto: 

1) TCP/IP fissa requisiti minimi per il collegamento alla rete, fornen- 
do gli standard compatibili per differenti sistemi di connessione alla rete. 
La flessibilità di TCP/IP permette di integrare differenti sistemi di con- 
nessione alla rete e accogliere altri protocolli (ragione per la quale alla 
fine si sono imposti come standard comuni). 


21 Cit. in B.M. Leiner, V.G. Cerf, D.D. Clark, R.E. Kahn, L. Kleinrock, D.C. Lynch, 
J. Postel, L.G. Roberts, S. Wolff, A Brief History of the Internet, cit., in particolare nel- 
la sezione History of the Future. 
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2) Lo stack di protocolli è di dominio pubblico, vale a dire che i pro- 
tocolli sono liberi da copyright. È questa una precondizione essenziale 
allo sviluppo della rete, poiché i protocolli e la loro documentazione tec- 
nica hanno potuto essere consultati, discussi, migliorati e implementati, e 
perché altri sviluppatori hanno potuto scrivere protocolli e programmi 
per costruire servizi e applicazioni sopra di esse. 

Ogni modifica viene comunicata alla rete, e gli utenti di Internet ne 
sono, dal principio in avanti, i produttori chiave. Senza tale condizione, i 
15 nodi di ARPANET del 1971 non sarebbero diventati oggi centinaia di 
milioni”. 

Nata in ambiente scientifico per lo scambio di documenti digitali, In- 
ternet si sviluppa senza frontiere in un processo in cui i governi hanno 
poca parte. Gli indirizzi non hanno una localizzazione fisica fissa, i costi 
per l'utente non dipendono dal contenuto trasmesso, non esiste un meto- 
do per identificare gli utenti, né un controllo centrale della rete (il solo 
coordinamento centralizzato è, lo si è accennato, il sistema di indirizza- 
mento). 

Si può dunque riassumere che le caratteristiche fondanti di Internet 
sono due: 

a) in primo luogo, l'architettura della connessione in rete è aperta, de- 
centrata, distribuita e multi-direzionale; 

b) in secondo luogo, tutti i protocolli di comunicazione e le loro im- 
plementazioni sono aperti, distribuiti e suscettibili di modifica (anche se 
non tutti sono modificabili)». 

L'infrastruttura fisica e lo stack di protocolli TCP/IP costituiscono le 
precondizioni per la nascita di ulteriori applicazioni che si servono di 
protocolli di livello superiore, tra i quali ricordiamo IMAP e POP per l'e- 
mail (che nasce nel 1972), il protocollo UUCP di Unix che consente la 
nascita di Usenet (1985), e molti altri ancora. 

Tuttavia, alla fine degli anni 80 l'interesse verso Internet in Europa era 
scarso; le istituzioni scientifiche e politiche europee stavano infatti ten- 
tando di progettare, con la poca lungimiranza di un eccessivo campanili- 
smo, una propria rete alternativa. Ma l'esistenza di protocolli standardiz- 
zati è per Berners-Lee l'occasione per dimostrare la possibilità di creare 
un ponte tra la pluralità di sistemi operativi e di reti esistenti. 

La prima proposta ufficiale di un sistema informativo ipertestuale che 
il giovane collaboratore inoltra al CERN risale al marzo 1989; nonostante 
non riceva alcuna risposta, nel maggio 1990 Berners-Lee presenta una 


22 Per i dati, si veda questo grafico: <http://www.totale.it/wp-content/uploads/di- 
mensioni-di-internet.jpg>. Si noti che esistono eccezioni a questo principio. Alcuni 
protocolli di routing dello strato della rete e alcuni protocolli dello strato applicativo 
(per esempio Skype) sono proprietari. 

23 M. Castells, Galassia Internet, Feltrinelli, Milano 2006 (ed. orig. 2001), p. 39. 
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seconda proposta”, anch'essa ignorata. Tuttavia, ottiene l'appoggio infor- 
male del capo della sua divisione, che gli permette di acquistare una 
macchina NeXT sulla quale comincia a programmare il software del suo 
progetto, che chiama World Wide Web. Con il sostegno pratico di Robert 
Cailliau, un ingegnere impiegato al CERN particolarmente sensibile al 
problema dell'interoperabilità tra hardware e software che si convince 
immediatamente della bontà dell'idea, decide di cercare un appoggio 
esterno al laboratorio di fisica, di nuovo senza successo. 

A] 1990 risale la definizione dei tre principi e pilastri del Web: lo 
schema per definire gli indirizzi dei documenti (Universal Resource Iden- 
tifier o URI”), il protocollo di trasmissione dei dati (Hypertext Transfer 
Protocol o HTTP) e il linguaggio di contrassegno che definisce la for- 
mattazione delle pagine contenenti link ipertestuali (Hypertext Mark-up 
Language o HTML): 


Il segreto stava nel definire poche regole base, comuni, di 'protocollo', 
per permettere ai computer di dialogare tra di loro, di modo che 
quando tutti i computer di ogni luogo avessero fatto altrettanto, il si- 
stema si sarebbe arricchito, invece di collassare. Per il Web tali ele- 
menti erano, in ordine decrescente di importanza, URI, HTTP e 
HTML, cioè gli identificatori universali, il protocollo di trasferimento 
e il linguaggio”. 


Poiché i tentativi di trovare collaboratori disposti a sviluppare un bro- 
wser, programma essenziale a rendere l'utilizzo del Web effettivo, naufra- 
gano, Berners-Lee decide di scriverlo da solo. Lo stesso accade per il pri- 
mo server Web, il programma che conserva le pagine in una parte del 
computer accessibile dall'esterno. 

Finalmente, registra il suo computer col nome info.cern.ch, mettendo 
a disposizione i suoi appunti, le specifiche di URI, HTTP e HTML e le 
informazioni sul progetto in corso?. Per dimostrarne gli usi possibili al- 
l'interno del CERN, si serve dell'elenco telefonico del laboratorio, che di- 
viene così accessibile a tutti. 


Quel che avevamo ottenuto fino a quel momento si basava su pochi 
princìpi chiave appresi con l'esperienza. Il punto cruciale era l'idea di 


24 La proposta originale è disponibile sul Web all'URL <http://www.w3.org/Hi- 
story/1989/proposal.html>. 

25 Contrariamente alla volontà dello stesso inventore del Web, l'URI sarà rinomi- 
nato Unique Resource Locator (URL). Sul dibattito in seno al W3C su questo punto, 
che ha una considerevole rilevanza filosofica, si veda: T. Berners-Lee, L'architettura 
del nuovo Web, cit., pp. 63-65. 

26 T. Berners-Lee, L'architettura del nuovo Web, cit., p. 44. 

27 Tutta la documentazione è accessibile nella sezione Design Issues sul sito del 
World Wide Web Consortium (W3C), all'URL <http://www.w3.org/DesignIssues>. 
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universalità, la rivelazione che un solo spazio dell'informazione po- 
tesse inglobare tutto, regalandoci un potere e una coerenza inauditi. 
Da qui derivavano molte decisioni tecniche. [...] Era una rivoluzione 
copernicana rispetto alla filosofia dei precedenti sistemi informatici. 
La gente era abituata ad andare a cercare le informazioni, ma di rado 
faceva riferimento ad altri computer, e anche in tal caso doveva ripe- 
tere una lunga sequenza complessa di istruzioni per accedervi?8. 


Viceversa, il nuovo sistema di documentazione avrebbe permesso di 
trovare l'informazione sfruttando i meccanismi mentali che tutti usiamo 
naturalmente per ricordare, basandosi sull'uso delle citazioni, una moda- 
lità di lavoro consueta agli accademici e, più in generale, agli scienziati, 
che come abbiamo visto è essenziale anche per la valutazione della ricer- 
ca. Ma in un modo radicalmente nuovo. 


La comunità dei ricercatori usa da sempre dei collegamenti del gene- 
re tra documenti cartacei: tavole dei contenuti, indici analitici, biblio- 
grafie e sezioni di consultazione e rimandi sono tutti quanti link iper- 
testuali. Però, sul web, i link ipertestuali possono essere seguiti in po- 
chi secondi, invece che in settimane di telefonate e inoltro della posta. 
E d'un tratto gli scienziati possono sottrarsi all'organizzazione se- 
quenziale di ogni pubblicazione e bibliografia, scegliendosi un per- 
corso di riferimenti che faccia al caso loro?. 


2. Dal Mundaneum al Memex: alcune premesse teoriche 


All'importanza del collegamento nei sistemi di documentazione e al- 
l'idea di ipertesto si erano già dedicati, prima di Ted Nelson e di Berners- 
Lee, scienziati di diverse discipline. Tra la fine dell'Ottocento e la prima 
metà del Novecento sono in particolare documentaristi e ingegneri ad 
affrontare la questione della catalogazione e dell'accesso all'informazione. 
Oltre al già citato Eugene Garfield, tra questi vale la pena ricordare in 
particolare Paul Otlet e Vannevar Bush. 

Nato a Bruxelles nel 1868 da un'agiata famiglia di avvocati, Paul Otlet 
intraprende nella prima giovinezza studi giuridici. Tuttavia, egli mostra 
da subito una vocazione agli studi speculativi, vocazione che viene inco- 
raggiata da Edmond Picard e Paul Héger, la cui frequentazione nell'am- 
biente familiare lo spingerà ad abbracciare la filosofia positivista. Nel 
1891 un gruppo di eruditi belgi fonda a Bruxelles la Société des Etudes 
Sociales et Politiques, che il giovane Otlet vede nascere con grande inte- 
resse. All'interno della Société, Henri La Fontaine dirige la Sezione di Bi- 


28 T. Berners-Lee, L'architettura del nuovo Web, cit., p. 42 e pp. 44-45. 
29 Ivi, p. 45. 
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bliografia. L'amicizia e la collaborazione con La Fontaine, premio Nobel 
per la pace nel 1913, ne incoraggiano la creazione di repertori bibliogra- 
fici in materia giuridica? e, più in generale, la formulazione di un proget- 
to innovativo che si propone la costituzione di centri di documentazione 
capaci di mettere a disposizione dell'umanità la grande varietà di docu- 
menti prodotti nelle diverse discipline. Il suo primo saggio di bibliografia 
(Un Peu de Bibliographie), in cui esprime apprezzamento per una biblio- 
grafia di matrice positivista e per il positivismo in generale, risale al 
1892. 

Convinto sostenitore della necessità che le scienze umane e sociali 
imitino le cosiddette scienze dure, occupandosi del problema del registro 
delle conoscenze umane, Otlet si occuperà in seguito della catalogazione 
delle fonti sociologiche. Con la creazione del catalogo, Otlet si persuade 
della necessità di una classificazione, cioè di un vocabolario controllato 
che consenta di descrivere con esattezza i diversi materiali. 

Nel 1893, la Sezione di Bibliografia si trasforma nell'Istituto Interna- 
zionale di Bibliografia Sociologica (IIBS). La bibliografia viene intesa da 
Otlet e La Fontaine come una formula sintetica che permette di rimedia- 
re ai grandi mali che affliggono le scienze sociali e, più in generale, l'u- 
manità. Entrambi coltivano infatti parallelamente due grandi passioni: la 
documentazione e il pacifismo?!. 

È su tali premesse che la creazione di una disciplina che permetta una 
comunicazione di tipo universale si colloca come parte fondamentale del 
lavoro quotidiano degli uomini di scienza. La scienza della documenta- 
zione, come enunciata da Otlet, nasce dunque allo scopo di studiare i 
problemi della ricerca e del suo avanzamento, nel piano generale della 
comunicazione scientifica applicata al progresso umano. A tal fine si ren- 
dono necessarie una scienza e una tecnica della documentazione. 

Paul Otlet fonda così la teoria della documentazione come scienza 
che si occupa della classificazione dei dati relativi alla produzione, alla 
conservazione, alla circolazione e all'uso (o impatto) degli scritti e docu- 
menti di ogni specie. Il fine ultimo della sua impresa è unire l'umanità at- 
traverso l'opera scientifica. 


30 Nel 1891, Paul Otlet pubblica, assieme a Pierre Blanchemerle, Joseph Cassiers e 
Max Hallet, Le Sommaire périodique des revues de droit (Il Sommario periodico delle 
riviste di diritto), tavole mensili di tutti gli articoli giuridici pubblicati nei mensili 
belgi. Per una bibliografia completa dell'opera di Otlet, a cura di W. Boyd Rayward, si 
veda <https://www.ideals.uiuc.edu/html/2142/652/Paul%200tlet%20Bibiliography.- 
htm>. 

31 La sintesi di tale duplice interesse viene pubblicata in due saggi: il Traité de do- 
cumentation. Le livre sur le livre. Théorie et pratique, del 1934 e Monde: Essai d'uni- 
versalisme dell'anno successivo. Il primo è disponibile online all'indirizzo <https://ar- 
chive.ugent.be/handle/1854/5612>, il secondo all'URL <https://archive.ugent.be/han- 
dle/1854/8321>. 
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Otlet descrive la nascita di una nuova scienza che si scompone in un 
processo triadico: 1. la descrizione dei libri (biblioteconomia); 2. le leggi 
della loro produzione, conservazione e diffusione (bibliografia); 3. le ap- 
plicazioni pratiche delle conoscenze bibliografiche (documentazione). Le 
fasi del processo si propongono di risolvere altrettanti problemi metodo- 
logici che riguardano le scienze bibliografiche: il registro, la moltiplica- 
zione e la disponibilità dell'informazione. 

La scienza della documentazione si configura come disciplina che si 
occupa dello studio del libro e del documento e che assume come sue 
parti biblioteconomia e bibliografia, che il documentarista teorizza e si- 
stematizza nel Traité de documentation, il primo trattato scientifico di 
teoria della documentazione pubblicato a Bruxelles nel 1934. 

Con una metafora efficace, Otlet definisce la sua nuova disciplina 
«metallurgia documentale»: un processo di estrazione, separazione e 
trattamento dei materiali intellettuali grezzi, che avviene tramite l'elabo- 
razione e l'interscambio di conoscenze. Così, la documentazione viene 
intesa come corpo epistemologico che è al contempo oggetto di studio e 
strumento metodologico. 

Su un piano applicativo, Otlet e La Fontaine danno vita a un insieme 
di creazioni innovative destinate a orientare la scienza documentale dei 
decenni successivi: l'Istituto internazionale di bibliografia, centro dell'at- 
tività bibliografica europea; il Repertorio bibliografico universale, un ca- 
talogo di cataloghi che già nel 1897 contiene un milione e mezzo di regi- 
stri bibliografici; la scheda bibliografica, un innovativo strumento docu- 
mentale che ancora oggi costituisce uno standard della biblioteconomia; 
la Classificazione Decimale Universale, un adattamento della classifica- 
zione universale di Dewey di cui Otlet viene a conoscenza nel 1894. Ele- 
menti, questi, che danno origine al paradigma documentale otletiano. 

Ma l'esperienza più importante e significativa dell'opera di Otlet è il 
Palais Mundial, che sfocia successivamente nel Mundaneum, una sorta 
di universitas universale, un tempio del sapere consacrato alla conoscen- 
za scientifica. II Mundaneum, che avrebbe ospitato una Biblioteca Inter- 
nazionale, l'istituto Internazionale di Bibliografia, il Repertorio Biblio- 
grafico Universale, una Enciclopedia di Documentazione, l'officina di 
Associazioni Internazionali e l'Università Internazionale, si configura 
come un luogo animato dai princìpi di totalità, simultaneità, gratuità, vo- 
lontarietà, universalità, e da un ideale di vita internazionale, sostenuta 
dalla ragione e dedicata alla cooperazione e alla pace nel mondo. Un 
tempio consacrato all'intelletto, nel quale i ricercatori e gli intellettuali 
del mondo potessero avere la possibilità di studiare tutto quanto prodot- 
to e pensato dagli uomini nel corso dei secoli. 

Il progetto ottiene grandi riconoscimenti internazionali, ma uno scar- 
so appoggio istituzionale. Otlet getta tuttavia le basi del lavoro documen- 
tale, indicando gli attrezzi del mestiere necessari al lavoro di ricerca. Di- 
versi studi su Otlet lo hanno indicato come precursore dell'idea di iperte- 
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sto”. L'uso delle schede e dei cataloghi proposto dal padre della scienza 
documentale dà vita a un nuovo paradigma, in cui la scheda bibliografica 
corrisponde al nodo e i link che creano un sistema di navigazione iperte- 
stuale sono dati dai cataloghi. Il sistema di classificazione proposto da 
Otlet si distingue come un nuovo dispositivo di accesso all'informazione 
e al documento, da molti considerato come l'inizio della rottura con il 
modello della struttura lineare. Il suo interesse si concentra sugli aspetti 
di un problema centrale per la società, le cui conseguenze sono tanto tec- 
nico-organizzative quanto teoretiche: il problema di rendere la cono- 
scenza facilmente accessibile e consultabile dall'umanità. 

È questo un tema che lo avvicina a Vannevar Bush, che nel 1945 pub- 
blica il famoso saggio As we may think”. «La conoscenza, scrive, per es- 
sere utile alla scienza deve poter essere continuamente ampliata, in pri- 
mo luogo archiviata e soprattutto consultata». Preside della facoltà di in- 
gegneria al MIT tra il 1932 e il 1938, in seguito Bush diventa direttore 
capo dell'Ufficio americano per la Ricerca e lo Sviluppo scientifico e con- 
sigliere scientifico del Presidente. Nello stesso anno in cui pubblica As 
we may think, indirizza al presidente Truman un rapporto* in cui, con 
sguardo lungimirante, sostiene l'importanza della ricerca di base; un do- 
cumento che nei decenni successivi si rivelerà determinante nell'orienta- 
re la politica americana in materia di innovazione e sviluppo. Il rapporto 


32 Su questo argomento si vedano: W. Boyd Rayward, Visions of Xanadu: Paul 
Otlet (1868-1944) and Hypertext, «Journal of the American Society of Information 
Science», 45, 1994, pp. 235-250, <http://people.lis.uiuc.edu/~wrayward/otlet/xana- 
du.htm>; P. Arnau Reved, Trascendencia de la vida y obra de Paul Otlet, 
<http://www.ucm.es/BUCM/revistas/byd/11321873/articulos/RGID9595220153A.P- 
DF>; R. Day, Paul Otlet's book and the writing of social space, «Journal of the Ameri- 
can Society of Information Science», 48, 4, 1997, pp. 310-17; I. Rieusset-Lemarié, P. 
Otlet's Mundaneum and the International Perspective in the History of Documentation 
and Information Science, «Journal of the American Society of Information Science», 
48, 4, 1997 pp. 301-310; M. Buckland, What is a Document?, «Journal of the Ameri- 
can Society of Information Science», 48, 9, 1997, pp. 804-809, «http://people.i- 
school.berkeley.edu/~buckland/whatdoc.html>; C. van den Heuvel, Mundaneum. 
Architectures of Global Knowledge: The Mundaneum and the World Wide Web, «Desti- 
nation Library», 15, 2008, pp. 48-53, <http://www.virtualknowledgestudio.nl/staff/ 
charles-van-den-heuvel/vdheuvel-mundaneum.pdf>; J. M. Zurita Sànchez, El para- 
digma otletiano como base de un modelo para la organización y difusión del conoci- 
miento cientifico, Tesi di laurea in biblioteconomia, Universidad nacional autónoma 
de México, 2001, <http://etdindividuals.dlib.vt.edu:9090/358/1/paradigma_otletia- 
no.pdf>. 

Li V. Bush, As we may think, «The Atlantic Monthly», 176, 1, 1945, pp. 101-108, 
<http://www.ps.uni-sb.de/-duchier/pub/vbush/vbush.shtml>, tr. it. Come possiamo 
pensare, in T. Nelson, Literary machines 90.1, cit., pp. 1/38-53. 

34 V. Bush, Science: The Endless Frontier. A Report to the President, Washington, 
U.S. Government Printing Office, 1945, <http://www.nsf.gov/od/lpa/nsf50/vbu- 
sh1945.htm>. L'impatto del report di Bush è notevolmente incisivo. Se nel 1930 il fi- 
nanziamento statale alla ricerca pubblica e privata è del 14%, nel 1947 passa al 56%. 
cfr. A. Mattelart, Storia della società dell'informazione, cit., p. 46. 
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di Bush segna «un autentico punto di svolta nella storia, evolutiva, della 
Repubblica della Scienza». Indicando nella scienza di base «le fondamen- 
ta su cui edificare la sicurezza nazionale (economica e sociale, prima an- 
cora che militare) della potenza che si accinge a vincere definitivamente 
la seconda guerra mondiale e a progettare il nuovo ordine mondiale per 
l'era di pace che sta iniziando», esso «propone un rapporto affatto nuovo 
tra scienza e politica». Bush sostiene la necessità che il governo federale 
smantelli l'Office of Scientific Research and Development, da lui diretto 
fino a quel momento, preservandone però lo spirito, e fornendo agli 
scienziati accademici 


risorse finanziarie e umane, perché possano realizzare in piena libertà 
le loro ricerche, anche quando si tratta di studi, come la matematica 
superiore o l'astrofisica, che non hanno un'immediata ricaduta prati- 
ca. [...] Le sue lucide e precise indicazioni saranno seguite da Harry 
Truman e da tutti i presidenti che lo seguiranno. La scienza assume 
davvero un ruolo strategico a tutto campo negli Stati Uniti. In ambito 
militare, certo. Ma anche e soprattutto in ambito civile. Nascono nuo- 
vi enti, come la National Science Foundation (Nsf), incaricata dal go- 
verno federale di sostenere e coordinare le attività di ricerca nelle 
università americane; o come i National Institutes of Health (Nih), 
incaricati di sostenere e coordinare a ogni livello le attività di ricerca 
a carattere biomedico. In definitiva, grazie alla precisa scelta politica 
consigliata da Vannevar Bush, la conoscenza scientifica diventa la 
leva dello sviluppo degli Stati Uniti d'America”. 


Ed è esattamente in quel clima e in quegli stessi organismi che vede la 
nascita Internet. Ma torniamo a As we may think. Se durante la seconda 
guerra mondiale Bush aveva messo la propria opera al servizio dello Sta- 
to e, al pari di altri scienziati tra cui vale la pena ricordare il matematico 
inglese Alan Turing, padre del moderno calcolatore e artefice della de- 
criptazione del codice tedesco Enigma, aveva ricoperto un importante 
ruolo nella ricerca militare, As we may think è una riflessione sul rappor- 
to tra la tecnologia e il problema, particolarmente attuale in epoca post- 
bellica, della pace nel mondo. Come può la tecnica, si domanda l'inge- 
gnere americano, contribuire al benessere dell'umanità? Bush risponde 
all'interrogativo sciogliendo, nel corso del saggio, un’altra questione che 
sta, a suo parere, a monte del problema: la questione riguarda il modo in 
cui il bagaglio di conoscenze umane possa creare le condizioni per la 
pace nel mondo. Perché le tecnologie possano mettere l'uomo in grado di 
costruire condizioni di vita migliori, una «casa ben arredata» in cui «vi- 


35 P. Greco, Il modello Venezia. La comunicazione nell'era post-accademica della 
scienza, in N. Pitrelli, G. Sturloni (a cura di), La comunicazione della scienza, Atti del 
I e II convegno nazionale, Zadig, 2004, <http://ics.sissa.it/conferences/csIntroduzio- 
ne.pdf>, pp. 9-10. 
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vere in buona salute» suggerisce Bush con un'immagine dall'assonanza 
kantiana”, è necessaria un'indagine sul metodo della ricerca e sul proces- 
so di costruzione della scienza. Il saggio non affronta dunque un tema 
meramente tecnico: viceversa, l'argomentazione su cui è imperniato è an- 
che e soprattutto una riflessione filosofica e politica sulle modalità di 
produzione e di trasmissione del sapere. 

Vannevar Bush fonda il proprio ragionamento su una importante 
premessa condivisa da buona parte della tradizione filosofica occidentale 
da Platone in poi, vale a dire il fatto che la conoscenza umana è un in- 
sieme collegato in un tutto che, in quanto tale, ha una dimensione uni- 
versale la quale trascende la singola vita individuale. Il sapere è tale in 
quanto frutto di un processo cumulativo, e si struttura, grazie alla colla- 
borazione degli scienziati, in sistemi collegati che includono l’intero pa- 
trimonio delle conoscenze umane. Per questo, l'accesso all'informazione 
scientifica è una condizione necessaria alla stessa possibilità della scien- 
za. 

Se la diffusione della stampa ha permesso all'umanità di produrre 
enormi quantità di informazioni a un ritmo sempre crescente, l'accre- 
scersi progressivo dei dati e delle conoscenze raccolti in libri, articoli e 
testi di varia natura non implica la possibilità di condividere tale patri- 
monio; inoltre, la crescente specializzazione del sapere, prosegue Bush, 
confligge con lesigenza di sistemi di comunicazione veloci ed efficienti. 

Il principale ostacolo all'accesso risiede negli alti costi di riproduzio- 
ne, ostacolo che puó essere tuttavia facilmente superato con l'ausilio di 
tecnologie in grado di comprimere grandi quantità di libri in dispositivi 
di piccole dimensioni. La proposta di Bush individua nell'uso delle mac- 
chine una soluzione al problema dell'archiviazione; ma il problema della 
consultazione del sapere è assai più serio e di difficile soluzione. Esso in- 
fatti coinvolge l'intero processo grazie al quale l'uomo trae vantaggio dal 
suo bagaglio di conoscenze: la selezione. Bush riconosce che il cuore del 
problema è più profondo del semplice ritardo nella meccanizzazione del- 
le biblioteche. Il processo di selezione è «come uno scalpello nelle mani 
di un ebanista», che devessere pertanto considerato e affrontato con ri- 
guardo al metodo della ricerca scientifica, cui l'ingegnere americano de- 
dica ampio spazio nella parte centrale del saggio. 

Il cuore del problema deve essere ricondotto all'artificiosità dei siste- 
mi di indicizzazione in uso negli archivi, che organizzano l'informazione 
gerarchicamente, in base a una struttura ad albero. Poiché le informazio- 


36 V. Bush, Come possiamo pensare, cit., p. 1/53. 

37 Nell'Architettonica della ragion pura Kant paragona l'edificio della conoscenza 
scientifica a una casa d'abitazione (I. Kant, Critica della ragion pura, Utet, Torino 
1967, A 707- B 735). 

38 Si veda in particolare il mito dell'anamnesis nel Menone, 81c-d (Platone, Meno- 
ne, Laterza, Roma-Bari, 2004, p. 34). 
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ni si trovano in un unico punto dell'archivio, a meno di duplicati, si de- 
vono avere regole per decidere quale cammino ci porterà a ciò che cer- 
chiamo. Il limite di tale struttura è che a un documento corrisponde un 
unico percorso. 


La mente umana non funziona in questo modo. Essa opera per asso- 
ciazioni. Una volta che essa abbia un elemento a disposizione, salta 
istantaneamente all'elemento successivo suggerito, in base a un in- 
treccio di piste registrate nelle cellule del cervello, dalla associazione 
dei pensieri. 


Bush suggerisce così di ripensare la selezione dell’informazione a par- 
tire dal modo in cui funziona la nostra mente, e indica nel Memex^, una 
macchina fotoelettronica in grado di attuare e seguire riferimenti incro- 
ciati su microfilm servendosi di codice binario, fotocellule e fotografia 
istantanea, un esempio di meccanizzazione della selezione per associa- 
zione piuttosto che per indicizzazione. L'accesso virtualmente universale 
al patrimonio culturale dell'umanità e l'impiego delle macchine nella ri- 
cerca hanno, ai suoi occhi, un potenziale creativo dirompente. Se infatti 
non esistono sostituti meccanici per il pensiero creativo, ma pensiero 
creativo e pensiero essenzialmente ripetitivo sono molto diversi; tuttavia 
ogni qualvolta si combinano e si registrano fatti sulla base di processi lo- 
gici stabiliti, l'aspetto creativo «riguarda solo la scelta dei dati e del pro- 
cesso da impiegare, e da quel momento in poi la manipolazione è di na- 
tura ripetitiva, e dunque adatta per essere affidata alle macchine»*'. 

Il Memex è un dispositivo meccanico, una scrivania meccanizzata 
formata da schermi translucidi inclinati, una tastiera, e gruppi di bottoni 
e di leve. Al suo interno sono archiviati gli strumenti di lavoro del ricer- 
catore (i libri e gli articoli su cui lavora, come gli appunti che produce), 
proiettabili velocemente su schermi inclinati. Grazie al Memex è possibi- 
le consultare il proprio archivio tramite lo schema di indicizzazione tra- 
dizionale: basterà digitare il codice del libro desiderato, e la sua copertina 
sarà rapidamente proiettata su uno dei visori. Ma la caratteristica fonda- 
mentale del “Memory extender” è che esso consente al ricercatore di col- 
legare stabilmente due testi qualsiasi premendo un semplice tasto‘. La 
valenza pratica della macchina ideata da Bush è descritta dall'autore 
come segue: 


39 V. Bush, Come possiamo pensare, in T. Nelson, Literary machines 90.1, cit., p. 
1/49. 

40 Il nome deriva dalla contrazione dell'espressione “Memory extender". 

41 V. Bush, Come possiamo pensare, cit., p. 1/49. 

42 A differenza dei link sul Web, i collegamenti immaginati da Bush sono bidire- 
zionali; vale a dire che ogni volta che un elemento viene proiettato, un altro elemento, 
ad esso collegato, può essere istantaneamente richiamato premendo un bottone, e vi- 
sualizzato. 
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Il proprietario del memex, per esempio, è interessato alle origini e alle 
proprietà dell'arco. In particolare, sta ricercando il motivo, nelle bat- 
taglie delle Crociate, per cui l'arco corto turco fosse superiore all'arco 
lungo inglese. Ha a disposizione dozzine di libri e articoli pertinenti 
nel suo memex. Dapprima sfoglia un'enciclopedia, trova un articolo 
interessante ma non approfondito, lo lascia proiettato. Poi, in un reso- 
conto storico, trova un altro argomento pertinente, e lo congiunge al 
precedente. Procede in questo modo, costruendo un percorso di mol- 
ti elementi. Di quando in quando inserisce un proprio commento, sia 
congiungendolo alla pista principale sia connettendolo come pista la- 
terale a un elemento particolare. Quando diventa evidente che le pro- 
prietà elastiche dei materiali disponibili erano fondamentali per il 
rendimento dell'arco, egli devia su una pista laterale che lo porta at- 
traverso libri di testo sull'elasticità e tavole di costanti fisiche. Inseri- 
sce una pagina di analisi scritta di suo pugno. In questo modo egli co- 
struisce una pista della sua ricerca attraverso il labirinto del materiale 
che ha a disposizione". 


Così, quando numerosi elementi sono stati congiunti per formare 
una pista, grazie al Memex possono essere esaminati l'uno dopo l'altro, 
velocemente o lentamente, muovendo una leva come quella usata per gi- 
rare le pagine del libro. E come se gli elementi, parti di libri preesistenti, 
venissero raccolti separatamente e quindi rilegati nuovamente assieme, 
in modo da formare un nuovo libro. 

Affrontando il problema della selezione dell'informazione, Bush resti- 
tuisce al ricercatore un ruolo attivo e fondante. 


Nascerà la nuova professione di battitore di piste, persone che si inge- 
gneranno a tracciare percorsi significativi attraverso l'immane mole 
dell'esperienza umana. L'eredità del maestro ai suoi discepoli non sa- 
ranno piü solo i suoi contributi alla conoscenza comune, ma l'intera 
impalcatura di conoscenze sulla quale essi sono stati costruiti‘. 


Lattività della ricerca si traduce praticamente nell'inserimento di ogni 
singolo elemento in una o più piste; percorsi che restano cosi patrimonio 
dell'umanità, tanto quanto i libri, e danno vita a enciclopedie di conce- 
zione radicalmente nuova, dotate di una trama di piste associative che le 
attraversano. L'utilità insita nella possibilità di conservare traccia dei pas- 
saggi del processo di ricerca è esemplificata con riferimento alla ricerca 
sulle origini e le proprietà dell'arco, come segue: 


43 V. Bush, Come possiamo pensare, cit., p. 1/51. 
44 Ivi, p. 1/52. 
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Qualche anno dopo, durante un suo colloquio con un amico, il di- 
scorso cade sui modi strani in cui le persone resistono alle innovazio- 
ni, anche se di vitale interesse. Egli dispone di un esempio, ed esatta- 
mente di come gli europei, pur riconoscendo che la loro arma aveva 
una gittata minore, si rifiutarono di adottare l'arco turco: dispone ad- 
dirittura di una pista al riguardo. Un tocco mostra l'elenco dei codici. 
La pressione di alcuni tasti porta all'inizio della pista. Una leva per- 
mette di scorrerla a piacimento, fermandosi sui punti interessanti e 
dipartendosi in escursioni laterali. È una pista interessante, pertinente 
alla discussione. Così aziona un riproduttore, fotografa l'intera pista e 
la passa all'amico perché la inserisca nel proprio memex, congiun- 
gendola opportunamente ad altre sue piste. 


Larticolo di Bush ha avuto un influsso fondamentale anche sulla mes- 
sa a punto dello Science Citation Index (SCI), uno strumento che, come 
abbiamo visto, ha un influsso importantissimo nella storia recente della 
comunicazione scientifica. Ma anche per lo sviluppo del Web che, pur 
basandosi anch'esso sulla centralità delle citazioni, ha proposto un mo- 
dello diverso e alternativo allo SCI, fondato sulle libere associazioni e 
sull'assenza di un'autorità centralizzata. 


3. Architettura del World Wide Web e architettura dell'informazione 


Nonostante alcune evidenti differenze, nel pensiero e nei progetti di 
Paul Otlet, Vannevar Bush ed Eugene Garfield è dunque possibile rinve- 
nire gli elementi essenziali a caratterizzare la filosofia e i principi che 
stanno alla base del Web. Le implicazioni di un sistema di documenta- 
zione ipertestuale universale sono discusse dallo stesso Berners-Lee in 
una lezione tenuta in Giappone nel 2002‘. 


Il concetto del Web ha integrato molti diversi sistemi informativi di- 
sparati, creando uno spazio immaginario astratto in cui le differenze 
tra essi fossero ininfluenti. Il Web doveva includere ogni sorta di in- 
formazione su qualunque sistema. Lunica idea comune necessaria a 
mettere ció assieme fu identificare un documento tramite lo Univer- 
sal Resource Identifier (URI). Direttamente da ció sono come piovute 
architetture (design) di protocollo (come HTTP) e di formati di dati 
(come HTML) che hanno permesso ai computer di scambiarsi infor- 
mazioni stabilendo una corrispondenza tra i propri formati locali e 
standard in grado di offrire interoperabilità globale”. 


45 Ivi, p. 1/51. 
46 T. Berners-Lee, The World Wide Web - Past, present, future. Exploring Universa- 
lity, 2002, <http://www.w3.org/2002/04/Japan/Lecture.html>. 
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In termini semplificati, Berners-Lee spiega che il Web non è un pro- 
gramma ma un insieme di protocolli che richiede a ciascuno di assegna- 
re un nome unico ai documenti. Si tratta di una richiesta inaggirabile in 
quanto necessaria al suo funzionamento, ma ampia: è infatti l'unico limi- 
te che l'architettura del Web impone alla rappresentazione e alla organiz- 
zazione dei dati. 

Un esempio ci aiuta a capire come l'architettura del Web si basi su tre 
principi fondamentali, associati ai tre pilastri tecnici sopra ricordati: l'i- 
dentificazione (che avviene tramite URI), l'interazione (possibile grazie 
ai protocolli, di Internet [TCI/IP] e del Web [HTTP]) e i formati (nell'e- 
sempio, XHTML, che costituisce una variante di HTML): 


Progettando un viaggio in Messico, Nadia consulta il servizio meteo- 
rologico di Oaxaca “http://weather.example.com/oaxaca” su una pati- 
nata rivista di viaggi. Nadia ha sufficiente dimestichezza col Web per 
capire che http://weather.example.com/oaxaca è un URI e che è vero- 
simile che possa reperire informazioni relative al suo bisogno tramite 
un browser. Quando inserisce l'URI nel suo browser: 

1. Il browser riconosce che ciò che Nadia ha scritto è un URI. 

2. Il browser compie l'azione di recupero dell'informazione in accordo 
con la sua configurazione di comportamento per le risorse identifica- 
te tramite lo schema URI “http”. 

3. L'autorità responsabile di ^weather.example.com" offre le informa- 
zioni in risposta alla richiesta. 

4. Il browser interpreta la risposta, identificata come XHTML dal ser- 
ver, e se necessario offre ulteriori azioni di recupero per elementi gra- 
fici ivi contenuti e altri contenuti. 

5. Il browser mostra l'informazione recuperata, che include link iper- 
testuali ad altre informazioni. Per trovarle, Nadia puó seguire questi 
link ipertestuali'*. 


Nella sua lezione, Berners-Lee insiste sul fatto che il passato, il pre- 
sente e soprattutto il futuro del Web dipendono dal modo in cui viene 
garantita e protetta l'universalità del sistema. Sul piano tecnico, ció é pos- 
sibile postulando la separazione tra contenuto dell'informazione e forma 
in cui essa viene veicolata da due punti di vista principali: in primo luo- 
go, mantenendo valida la condizione che ha permesso la nascita della ra- 
gnatela ipertestuale su Internet, vale a dire la sua indipendenza dal so- 
strato materiale (hardware) e dal modo in cui le idee sono codificate e 


47 Ivi. Le specifiche URI, HTTP e HTML formano cosiddetti “bus” che connetto- 
no i programmi che risiedono sul computer dell'utente (detto client) ad altri pro- 
grammi installati su computer remoti (cosiddetti server) che forniscono le informa- 
zioni. 

48 I. Jacobs, N. Walsh (a cura di), Architecture of the World Wide Web. Volume 
One, 2004, <http://www.w3.org/TR/webarch/>, p. 6. 
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veicolate (software); in secondo luogo, definendo con maggior rigore i 
confini tra “documenti” e “dati”, i primi dedicati alla lettura da parte degli 
uomini, i secondi interpretabili dalle macchine. 

Nella conferenza giapponese, Berners-Lee ricorda l'esigenza che ha 
dato origine al World Wide Web, quella di mettere a disposizione degli 
ospiti del CERN uno strumento comune che permettesse loro di condivi- 
dere documenti in rete. Si è osservato come l'idea di Berners-Lee si fon- 
dasse su un principio filosofico semplice e, assieme, forte: creare un siste- 
ma di condivisione dei documenti “leggero”, fondato sulla sottrazione, 
piuttosto che sull'addizione di requisiti. Così operando, il sistema pensa- 
to dallo scienziato inglese sarebbe stato facilmente condivisibile da diver- 
si computer, sistemi operativi e programmi applicativi, e, in quanto tale, 
universale, cioè aperto a tutti coloro che volessero connettervisi. Da un 
punto di vista pratico, l'universalità del World Wide Web è garantita dal- 
le specifiche del W3C*, che raccomandano: 


1. L'indipendenza dall'hardware e dal software, importanti nel preve- 
nire tanto la frammentazione in molti ipertesti sconnessi e proprietari 
quanto il pericolo che il Web finisca sotto il controllo monopolistico di 
una data società o di un solo stato; 

2. l'adozione di standard per la codifica dei caratteri che permettono 
la presenza sul Web alle diverse lingue del mondo; 

3. La creazione e la diffusione di standard per l'accessibilità, che tute- 
lano chi è svantaggiato in termini di capacità (di vedere, sentire, muover- 
si e capire) e chi dispone di macchine con tecnologie obsolete. 


La riflessione del padre dell'ipertesto globale si sposta dunque su un 
topos della teoria informatica, la dicotomia tra cervello e macchina e tra 
“rima” e “ragione”. Se il cervello umano funziona tramite un complesso 
sistema di associazioni, e possiede la capacità di effettuare collegamenti 
che rientrino in un sistema coerente e consistente di conoscenze, le mac- 
chine, viceversa, hanno enormi capacità di calcolo, e possono processare 
l'informazione in forma di tabelle, vale a dire secondo una struttura ge- 
rarchica. 

Per disporre di strumenti informativi più ricchi, l'architettura del Web 
deve pertanto definire con precisione i confini tra i “documenti” (i conte- 
nuti accessibili agli uomini) e i “dati”; una reale separazione tra docu- 
menti e dati permetterà alle macchine di processare le informazioni, una 
possibilità resa oggi complicata dal fatto che la gran parte dell’informa- 


49 Il W3C (acronimo di World Wide Web Consortium) è un organismo misto 
pubblico-privato con sede al MIT e nato allo scopo di promuovere e sviluppare tec- 
nologie che garantiscano l'interoperabilità sul Web. Sul sito del W3C (<http://www.- 
w3.org/>) si trovano le specifiche e le linee guida del consorzio, oltre a software e a 
particolari applicazioni. 
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zione collegata in forma di ipertesto nella ragnatela condivisa “World 
Wide” contiene entrambi gli elementi mescolati”. 

Berners-Lee ha cura di precisare che non intende sostenere la possi- 
bilità di un'intelligenza artificiale - ne è conferma il presupposto su cui si 
fonda il suo ragionamento, la netta differenza tra il funzionamento del 
cervello umano e della macchina. Egli vuole semplicemente sottolineare i 
notevoli vantaggi che la possibilità di trattare informazione semantica- 
mente strutturata reca con sé, favorendo l'interoperabilità, la portabilità e 
la durabilità dell'informazione (il riuso della conoscenza), e aprendo 
nuove possibilità di selezione del sapere. 

Il discorso di Berners-Lee affronta un'altra questione centrale per la 
comunicazione scientifica: quella della selezione del sapere secondo cri- 
teri di “qualità”. Se «è noto che una raccolta di testi, come un insieme di 
report tecnici o una biblioteca, include soltanto quegli articoli che rag- 
giungano un certo livello di qualità» e «alcuni ritengono l'assenza di si- 
mili sistemi un limite del Web», tuttavia, precisa, è importante che il Web 
in sé non tenti di promuovere una singola nozione di qualità, ma conti- 
nui a raccogliere ogni informazione, vera o falsa che sia. È questa una ca- 
ratteristica che può certamente rappresentare un limite. Tuttavia, un'au- 
torità centrale che esercitasse un controllo sulla qualità sarebbe assai più 
dannosa degli svantaggi che l'apertura del sistema può comportare; e se 
nessuno può essere in alcun modo obbligato a leggere letteratura di bassa 
qualità, è altresì vero che, come mostra la storia della scienza, appunti 
che oggi sono considerati marginali potrebbero, un domani, essere a fon- 
damento di nuove idee dalla portata rivoluzionaria. Pertanto, il problema 
della selezione dell'informazione secondo criteri di qualità dev'essere 
così riformulato: «Come possiamo fornire all'utente la percezione sog- 
gettiva di qualità elevata, e allo stesso tempo mantenere il Web aperto a 
persone i cui criteri di giudizio sono diversi?». La questione, risponde il 
suo inventore, dovrà essere affrontata dotando i lettori di strumenti di fil- 
tro in grado di sfruttare l'organizzazione semantica dell'informazione, 
che trasformeranno i ricercatori in veri e propri “battitori di piste” i qua- 
li, come nell'esempio di Bush, potranno scambiarsi e condividere i per- 
corsi e crearne di nuovi, mantenendo comunque l’ipertesto globale svin- 
colato da una autorità centrale che decida quale informazione è appro- 
priata, e per chi. 


50 La formattazione dei dati in HTML non permette che l'informazione sia piena- 
mente interpretabile dalle macchine; é questo un limite strutturale del linguaggio, che 
non consente di separare pienamente il contenuto dalla sua struttura. Tuttavia, la na- 
scita di nuovi formati di codifica (primo tra tutti XML, acronimo di Extensible Mar- 
kup Language) e di nuove tecnologie di cui il W3C si é fatto promotore (che rientra- 
no nel cosiddetto Web semantico) stanno favorendo l'accentuarsi di questa separazio- 
ne. 
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Quest'ultimo punto, assieme agli altri discussi nel presente paragrafo, 
riguarda una questione più generale che è molto importante per la di- 
scussione qui proposta: quella dell'organizzazione della conoscenza o, in 
termini più astratti, dell'architettura dell'informazione. Su questo tema, 
un contributo puó venire dai principi a fondamento dell'organizzazione 
della conoscenza emersi da secoli di ricerche, in primo luogo biblioteco- 
nomiche, cui l'idea e lo sviluppo del Web, come osservato nel secondo 
paragrafo, deve molto. 

Se non è questa la sede per ricostruire la genesi della bibliotecono- 
mia, è utile tornare su alcuni passaggi della storia delle classificazioni per 
comprendere come il problema dell'organizzazione della conoscenza può 
essere affrontato nell'ambiente digitale e sullo spazio del Web. È cosa 
nota che l'origine della scienza moderna della classificazione si debba ai 
botanici, Konrad Gesner per primo e poi Carlo Linneo, che a metà del 
diciottesimo secolo creò un sistema di classificazione degli organismi vi- 
venti tutt'oggi utilizzato, basato su un grande albero gerarchico! Le 
grandi classificazioni biblioteconomiche (la classificazione decimale di 
Dewey [CCD], la classificazione Decimale Universale [CDU] di Otlet e 
di La Fontaine, la Library of Congress Classification [LCC]) sono loro 
debitrici. Ma le svolte più significative per la ricerca e la selezione dell'in- 
formazione nel Novecento sono dovute a due studiosi: il primo è Charles 
Ammie Cutter, creatore dei Library of Congress Subject Headings, che 
ha affrontato la difficile questione delle ricerche per soggetto, stabilendo 
cinque regole convenzionali che rispecchiano l'impostazione filosofica 
dello stesso Berners-Lee: 1. uniformità: il concetto dev'essere formulato 
sempre nello stesso modo; 2. univocità: a un nome, deve corrispondere 
sempre lo stesso oggetto; 3. esaustività: il tema di un documento dev'es- 
sere descritto in modo completo; 4. specificità: un concetto dev'essere 
rappresentato in modo esatto dal linguaggio di indicizzazione; 5. predit- 
tività: il catalogo deve rispondere alle aspettative degli utenti”. 

Il secondo è Shiyali Ramamrita Ranganathan, matematico e bibliote- 
cario indiano che negli anni 30 ha inventato il metodo dell'analisi a fac- 
cette. 


Una faccetta (in inglese "facet") è un particolare aspetto sotto il quale 
un argomento viene trattato; secondo Ranganathan, le faccette di 
qualsiasi classe si possono ricondurre a cinque categorie fondamenta- 
li: personalità (l'oggetto centrale di un discorso), materia (i compo- 
nenti e le proprietà dell'oggetto), energia (le caratteristiche dinamiche 
dei processi che lo interessano), spazio (i suoi elementi geografici o in 
genere spaziali), e tempo (le sue fasi cronologiche). Con una classifi- 


51 P. Denis, G. Gohan, Storia della biologia, Einaudi, Torino 1999 (ed. orig. 1997). 
52 C. Gnoli, V. Marino, L. Rosati, Organizzare la conoscenza. Dalle biblioteche al- 
l'architettura dell'informazione, Tecniche Nuove, Milano 2006, p. 9. 
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cazione a faccette, il contenuto di un documento può essere descritto 
analiticamente nei suoi diversi aspetti; questi sono poi espressi tutti 
insieme, secondo una sequenza determinata da regole di funzionalità: 
perciò Ranganathan definisce questo tipo di classificazione analitico- 
sintetica". 


Si tratta di un sistema rivoluzionario, anche se in pratica non molto 
applicato, perché permette di far rientrare un elemento in più categorie a 
differenza di quanto avviene nelle classificazioni ad albero. Si osservi an- 
che, a margine, che Ranganathan non riteneva che i sistemi informatici 
avrebbero costituito uno strumento in grado di risolvere il problema del- 
la selezione dell'informazione tout-court. L'esempio che riportiamo sotto 
illustra il suo pensiero in proposito. 


Una questione importante è: possono i classificazionisti e i classifica- 
tori abdicare alla loro funzione e dipendere dal calcolatore, lasciando 
che esso prenda il loro posto nelle procedure che permettono al servi- 
zio bibliotecario di soddisfare tutte le cinque leggi della bibliotecono- 
mia? No, non possono. Perché la classificazione richiede il discerni- 
mento, discernimento del soggetto del documento, in tutte le faccette 
e le schiere che in esso si manifestano. Questo non si può fare con l'a- 
nalisi statistica delle parole presenti nel documento, che è tutto quello 
che può fare la macchina. 

Un calcolatore può informare un lettore, quasi istantaneamente, della 
collocazione del libro di cui ha bisogno in quel momento, egli ne cita 
dettagli come l'autore e il titolo. Perché questo non comporta alcun 
discernimento. Ma l'esperienza insegna che la maggior parte dei let- 
tori non sempre vuole o può cercare il suo documento per autore o 
per titolo. L'approccio più popolare è quello per soggetto in termini 
precisi, soprattutto se è un lettore impegnato in settori di frontiera 
della conoscenza [...]. Un paragone familiare è l'incapacità di una si- 
gnora che desidera un nuovo sari (l'abito di seta colorata indossato 
dalle signore indiane) di specificarne con precisione il colore, il mo- 
dello e gli altri dettagli. È raro che suo marito riesca a soddisfarla se è 
guidato unicamente dalle sue indicazioni verbali. Tuttavia, nel mo- 
mento in cui il negoziante le dispiega davanti un assortimento di sari 
colorati, la signora è in grado di fare la sua scelta con piena soddisfa- 
zione senza alcuna perdita di tempo. Lo stesso succede con un lettore: 
il soggetto specifico di suo interesse spesso è ineffabile. Per questo, il 
browsing in una successione classificata di libri, o di voci di un cata- 
logo, è una necessità." 


53 C. Gnoli, Il tavolino di Ranganathan, «Bibliotime», III, 3, 2000, <http://www2. 
spbo.unibo.it/bibliotime/num-iii-3/gnoli.htm#faccette>. 

54 S.R. Ranganathan, Prolegomena to Library Classification. Asia Publishing Hou- 
se, New York, 1967 (ed. orig. 1937), <http://dlist.sir.arizona.edu/1151/>, XA 6, 61, 
<http://dlist.sir.arizona.edu/1151/23/ProlegomenaX.pdf>, tr. it. in C. Gnoli, V. Mari- 
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Tale affermazione può essere esaminata e discussa alla luce delle tec- 
nologie oggi a disposizione, come cercheremo di fare nei prossimi capi- 
toli. Qui tuttavia non stiamo considerando il Web come strumento, ma 
come spazio di documentazione. A tale proposito, può essere utile esplo- 
rare un'altra analogia, quella tra il libro (e, in senso generale, la bibliote- 
ca) e il nuovo spazio di documentazione inaugurato dal Web attraverso 
le cinque leggi della biblioteconomia che il bibliotecario indiano formulò 
nel 19315 e che sono considerate la base scientifica da cui poter dedurre 
le pratiche di funzionamento di ogni buona biblioteca: 

1. I libri sono fatti per essere usati. I bibliotecari perciò devono pro- 
muovere l'accesso alla conoscenza e la disseminazione dei suoi prodotti. 

2. Ad ogni lettore il suo libro. Pertanto, chiunque acceda a una biblio- 
teca, indipendentemente dall'età, dal sesso, dalle capacità e dalla propen- 
sione a leggere, deve poter usufruire di tutti i libri in essa contenuti. 

3. Ad ogni libro il suo lettore. È dunque compito dei bibliotecari fare in 
modo che un libro sia facilmente raggiungibile dal lettore potenzialmen- 
te interessato. 

4. Non far perdere tempo al lettore. È essenziale che il servizio sia effi- 
ciente, sia per i lettori che per la biblioteca. 

5. La biblioteca è un organismo che cresce. Si stabilisce così un'analo- 
gia tra la biblioteca e l'individuo, e anche una relazione con le evoluzioni 
tecnologiche che possono determinare una trasformazione della bibliote- 
ca stessa. 

In un articolo recente, Alireza Noruzi ha proposto un'applicazione 
delle cinque leggi di Ranganathan al Web/*: 

1. Le risorse sul Web sono fatte per essere usate. 

Questa legge implica il fatto che il Web debba poter essere usato e 
servire come strumento per l'apprendimento, e che l'informazione debba 
essere a disposizione di tutti: degli utenti, di chi fa ricerca e dell'intera so- 
cietà. Il fatto che sia stato pensato perché le risorse siano pubblicabili 
senza alcun filtro centralizzato, rispetta questa prima legge. Anche l'esi- 
stenza di strumenti come l'Internet Archive”, un sito che indicizza tutte 
le pagine del Web nel corso del tempo, risponde a questa esigenza. Se 
una pagina scompare, è possibile rintracciarla tramite la Wayback machi- 
ne, un motore di ricerca che attinge alle risorse non più attive. 

2. Ad ogni utente, la sua risorsa. 

La seconda legge ha diverse implicazioni importanti per il Web, rive- 
lando «il bisogno fondamentale di un equilibrio tra la creazione di risor- 


no, L. Rosati, Organizzare la conoscenza, cit., pp. 30-31. 

55 Cfr. S.R. Ranganathan, Five Laws of Library Science, Madras Library Associa- 
tion, Madras, Edward Goldston, London 1931, <http://dlist.sir.arizona.edu/1220/>. 

56 A. Noruzi, Application of Ranganathan's Laws to the Web, «Webology», 1, 2, 
2004, <http://www.webology.ir/2004/v1n2/a8.html>. 

57<http://www.archive.org/>. 
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se Web e il diritto basilare di tutti gli utenti ad avere accesso alle risorse 
Web di cui hanno bisogno, in ogni parte del mondo». E un aspetto che 
mette al centro la questione della diffusione e della disseminazione, sia in 
termini di politiche di accesso all'informazione (da parte degli esseri 
umani e dei motori di ricerca) resistenti alla censura, sia sul piano della 
costruzione di collezioni valide, esaustive e coerenti e pensate per tutti gli 
utenti e indipendentemente dal sesso, dall'età, dalla religione etc. 

3. Ad ogni risorsa, il suo utente. 

La terza legge afferma che una risorsa sul web esiste per ogni utente, e 
può essere tradotta in pratica tenendo a mente la necessità di connettere 
le risorse agli utenti, attraverso gli strumenti che il Web e la rete mettono 
a disposizione: mailing list e gruppi di discussione, indicizzazione nei 
motori di ricerca, linking a pagine già esistenti e pertinenti, costruzione 
di mappe strutturate dei siti web, che facilitino la navigazione e il reperi- 
mento delle informazioni. 

4. Non far perdere tempo all'utente. 

Questa legge è direttamente collegata alla precedente e costituisce 
una sfida per ogni progettista e sviluppatore. È fondamentale che il desi- 
gn di un sito sia pensato in modo da aiutare l'utente a trovare rapida- 
mente l'informazione che cerca. «Questa quarta legge enfatizza un servi- 
zio efficiente per gli utenti, che implica una buona progettazione e una 
mappa/indice di un sito facile da capire»®. 

5. Il Web è un organismo che cresce. 

L'ultima legge è abbastanza banale da comprendere. Abbiamo già os- 
servato che pubblicare una pagina non necessita di alcun permesso. Per- 
ciò, quest'ultima legge costituisce una caratteristica vitale del Web e 


sottolinea la necessità di costanti aggiustamenti della nostra prospet- 
tiva nel rapportarci ad esso. Cambiamento e crescita vanno di pari 
passo, e richiedono flessibilità nella gestione delle collezioni, nell'uso 
del cyberspazio, nel mantenere e accrescere gli utenti e la natura dei 
programmi web. Le collezioni sul web aumentano e cambiano, così 
come cambiano le tecnologie dell'informazione e le stesse persone. 
Perciò, questa quinta legge riconosce che ci sarà indubbiamente una 
crescita e che dev'essere progettata in modo sistematico”, 


Si osservi in ultimo che sul Web l'utente sostituisce quello che nella 
biblioteca è il lettore. Utente è un termine che include il lettore, ma che 
comprende anche altri attori, primi tra tutti gli stessi computer. Per capi- 
re in che modo ciò possa e debba avvenire, è necessario considerare più 
da vicino i recenti sviluppi del Web. 


58 A. Noruzi, Application of Ranganathan's Laws to the Web, cit. 
59 Ibidem. 
60 Ibidem. 
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WEB DEI DATI E SOCIAL SOFTWARE 


1. Cenni di topologia delle reti 


Prima di introdurre ai recenti sviluppi del Web, è utile dare uno 
sguardo alla sua struttura da un punto di vista matematico. La conoscen- 
za della topologia delle reti risulta infatti essenziale sia alla comprensione 
delle reti telematiche, sia all'uso dei metodi e degli strumenti, in primo 
luogo i motori di ricerca, che caratterizzano la professione del ricercatore 
nell'epoca di Internet. 

Da un punto di vista topologico, sia Internet che il web sono grafi, 
vale a dire insiemi di vertici uniti da archi. La teoria dei grafi è stata inau- 
gurata da Eulero nel 1736! per risolvere un problema pratico che affligge- 
va gli abitanti di Kónigsberg. La città di Kónigsberg ha una geografia 
particolare: si trova alla confluenza di due fiumi, comprende un isolotto 
ed è divisa in quattro parti che al tempo di Eulero erano unite tramite 
sette ponti. Si narra che gli abitanti si divertissero a scommettere sulla 
possibilità di trovare un percorso che, partendo da una qualsiasi delle 
quattro zone della città, permettesse loro di attraversare ciascun ponte 
soltanto una volta, ritornando infine al punto di partenza. Il matematico 
rappresentò ciascuna delle quattro zone della città con un cerchio (“ver- 
tice”), indicando ogni ponte con una linea (“arco”) e fornì una dimostra- 
zione matematica dell'impossibilità di trovare un tale percorso? dando 
cosi origine alla cosiddetta teoria dei grafi (cfr. la figura 1 nella pagina se- 
guente). 

Il problema fu concretamente risolto, e, per buona pace dei suoi abi- 
tanti, nel 1875 a Kónigsberg fu costruito un ottavo ponte. 

La teoria inaugurata da Eulero é oggi considerata il fondamento della 


attuale concezione delle reti. Vale a dire che «nella loro architettura, i 


! Eulero, Solutio problematis ad geometriam situs pertinentis, 1736, «http://math.- 
dartmouth.edu/-euler/docs/originals/E053.pdf>. 

2 Eulero basò la sua dimostrazione sul fatto che i vertici con un numero dispari di 
spigoli debbono trovarsi al principio o al termine del percorso, e che un percorso che 
comincia in un punto e finisce in un altro non può avere più di due nodi siffatti. E fa- 
cile osservare che il grafo di Kónigsberg ha quattro nodi con un numero dispari di 
collegamenti e che quindi tale percorso non esiste. 


Francesca Di Donato, La scienza e la rete : l'uso pubblico della ragione nell'età del Web, 
ISBN 978-88-8453-494-1 (print) ISBN 978-88-8453-500-9 (online) 
© 2009 Firenze University Press 


60 LA SCIENZA E LA RETE 


grafi o le reti nascondono proprietà che possono limitare o favorire ciò 
che possiamo fare con loro»?. 


Figura 1. Il disegno originale di Eulero 


In un saggio recente, il fisico rumeno Albert-László Barabási riper- 
corre le tappe essenziali nella storia della scienza delle reti, e definisce un 
particolare modello teorico, le reti a invarianza di scala, di cui mostra 
esempi significativi. Internet, il World Wide Web, la rete delle citazioni 
scientifiche, le presenze sul set degli attori di Hollywood e persino la diff- 
usione dei virus hanno una topologia comune, ovvero sono riconducibili 
a quest'unico modello. Sono reti che obbediscono a leggi comuni. 

Si tratta di reti distribuite, dinamiche e in crescita, tenute insieme da 
una gerarchia di connettori, che formano una tela senza il ragno, vale a 
dire autorganizzata. Che cosa significa, esattamente? E possibile dare una 
risposta a questa domanda analizzando alcune caratteristiche di queste 
reti anche senza entrare in complesse definizioni matematiche. 

1. Il Web è un grafo (i cui vertici si chiamano “nodi” e gli archi “link”) 
orientato, cioé una rete diretta i cui link sono monodirezionali, vale a 
dire che sono orientati in un'unica direzione. In pratica, ció significa che 
nel momento in cui inserisco un link ipertestuale in una pagina Web, io 
stabilisco un collegamento dalla mia pagina alla pagina che cito, in modo 
analogo a quanto avviene in un libro, in cui le citazioni vanno in un'uni- 
ca direzione, verso scritti pubblicati in precedenza. 

2. Il Web è un “mondo piccolo, in cui il numero di passaggi necessari 
a raggiungere un punto qualunque del suo spazio é molto basso. La teo- 
ria dei mondi piccoli, nota anche come principio dei "sei gradi di separa- 
zione”, è stata definita dal sociologo americano Stanley Milgram come 
esito di un esperimento condotto nel 1961. Milgram si propose di ri- 


3 A.L. Barabási, Link. La scienza delle reti, Einaudi, Torino 2004, p. 14. 
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spondere alla questione: qual è la distanza tra due cittadini qualsiasi degli 
Stati Uniti? In altri termini: quanti collegamenti (link) sono necessari per 
connettere tra loro due individui che non si conoscono scelti a caso? Se- 
lezionò due destinatari finali (la moglie di uno studente di teologia nel 
Massachussetts e un agente di cambio di Boston) e scelse casualmente al- 
cuni abitanti di piccole città del Kansas e del Nebraska, a cui inviò una 
lettera in cui spiegò gli obiettivi dell'esperimento e le istruzioni da segui- 
re*. Il risultato fu sorprendente: in media, negli Stati Uniti, il numero mi- 
nimo di intermediari necessari per collegare due sconosciuti qualsiasi at- 
traverso persone di loro conoscenza è circa sei. Vale a dire che, più in ge- 
nerale, la società è una rete di sei miliardi di nodi in cui la distanza me- 
dia tra un nodo e l'altro non supera una manciata di link. 

È stato dimostrato che tale proprietà è scientificamente fondata e vali- 
da in diverse reti a invarianza di scala. Nel 2004, i gradi di separazione 
del Web erano diciannove. Questa caratteristica è propria anche della 
rete delle citazioni scientifiche, come mostra il numero di Erdos*. Paul 
Erdos era un matematico noto per aver collaborato con moltissimi scien- 
ziati e la cui produzione scientifica è stata molto vasta. Il numero a lui in- 
titolato misura la distanza dei membri della comunità scientifica da Er- 
dos, assegnando il numero 1 ai suoi coautori, cioè a coloro che hanno fir- 
mato con lui un testo, il 2 ai coautori dei suoi coautori, e via dicendo. I 
gradi di separazione tra Erdos e gli scienziati appartenenti al suo ambito 
disciplinare sono all'incirca sei. Si osservi però che Erdos (come Kevin 


4 Milgram inviò la lettera seguente: 

«COME PRENDERE PARTE A QUESTO STUDIO 

1) AGGIUNGETE IL VOSTRO NOME ALLA LISTA CHE TROVATE IN FON- 
DO A QUESTO FOGLIO, affinché chi riceve per primo la lettera possa sapere da chi 
proviene. 

2) STACCATE UNA CARTOLINA POSTALE, COMPILATELA E RISPEDITE- 
LA ALL'UNIVERSITA' DI HARVARD. L'affrancatura non è necessaria. La cartolina 
è molto importante: ci permetterà di seguire le tracce del documento nel suo viaggio 
verso il destinatario finale. 

3) SE CONOSCETE DI PERSONA IL DESTINATARIO FINALE, SPEDITEGLI/ 
LE DIRETTAMENTE IL DOCUMENTO. Fatelo soltanto se lo avete già incontrato 
in precedenza, e se vi date del tu. 

4) SE NON CONOSCETE DI PERSONA IL DESTINATARIO FINALE, NON 
CERCATE DI CONTATTARLO DIRETTAMENTE. SPEDITE INVECE QUESTO 
DOCUMENTO (COMPLETO DI CARTOLINA POSTALE) A UN VOSTRO CO- 
NOSCENTE CHE RITENETE ABBIA MAGGIORI PROBABILITA' DI CONOSCE- 
RE IL DESTINATARIO FINALE. Potete spedirlo a un amico, a un parente o a un co- 
noscente, ma dev'essere qualcuno a cui date del tu». Cit. in A.L. Barabási, Link. La 
scienza delle reti, cit., pp. 31-32. Si veda S. Milgram, The "Small World" Problem, «Psy- 
chology Today», 1, 1967, pp. 60-67. 

5 Sulla storia ele origini del numero di Erdos, si veda la relativa voce di wikipedia 
«http://it.wikipedia.org/wiki/Paul Erd96C59691s» (10/09). Cfr. anche C. Goffman, 
And what is your Erdos number?, «American Mathematical Monthly», 76, 1969. 
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Bacon nel mondo degli attori del cinema) ha alcune caratteristiche che lo 
rendono un nodo “particolare” nella rete. 

3. Il web è caratterizzato dalla presenza di connettori (hub) e di auto- 
rità (authorithy). I primi hanno un alto numero di link in uscita, puntano 
cioè a un numero elevato di risorse, come ad esempio i siti di ebay o 
Amazon; le seconde, viceversa, contengono molti link in entrata, cioè 
sono altamente citate (ne sono esempi i siti di istituzioni importanti o le 
homepage dei quotidiani principali). L'alto numero di link è misura della 
loro popolarità. Molti connettori sono anche autorità, per esempio Goo- 
gle. L'architettura del Web è dominata da pochissimi nodi altamente 
connessi (detti appunto hub) che tengono insieme molti nodi poco con- 
nessi. 


Figura 2. Pochi nodi altamente connessi (al centro) sono collegati alla 
maggior parte degli altri nodi, debolmente connessi. 


Tale caratteristica accomuna il Web anche alla rete della società uma- 
na: «Disseminate in varie occupazioni, esiste una manciata di persone 
che possiede l'abilità davvero straordinaria di stringere un numero ecce- 
zionale di amicizie e conoscenze. Sono i connettori». I connettori sono 
presenti in tutte le grandi reti complesse e svolgono un ruolo determi- 
nante. Sul Web, essi fungono da vetrine privilegiate. Rimanendo nell'am- 
bito della comunicazione scientifica, se consideriamo le risorse sulla rete 
al pari di libri e riviste, si può dire che i connettori agiscono come biblio- 
teche prestigiose o, meglio ancora, grandi librerie. Se una risorsa compa- 


6 M. Gladwell, I] punto critico. I grandi effetti dei piccoli cambiamenti, Rizzoli, Mi- 
lano 2000, cit. in A.L. Barabási, Link. La scienza delle reti, cit., p. 61. 
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re nella prima pagina in una query su Google è, per restare ai libri, come 
finire nella vetrina di un enorme negozio di una grande città: rende il 
nostro documento estremamente visibile”. 

4. Una caratteristica, piuttosto intuitiva, che deriva dalla precedente, è 
che sul Web il numero di link dà la misura di visibilità di un nodo. Mag- 
giori sono i link da e verso una pagina, più la pagina è visibile. 

5. Il Web è caratterizzato dalla legge 80/20, nota anche come princi- 
pio di Pareto, che è sintetizzabile nell'affermazione secondo cui, su gran- 
di numeri, la maggior parte degli effetti (indicativamente l'80%) è dovuta 
a un numero ristretto di cause (indicativamente, il 20%). Pareto dimostrò 
infatti che in una determinata regione solo pochi individui possedevano 
la maggior parte della ricchezza. La legge è stata tuttavia verificata grazie 
a osservazioni empiriche di numerosi fenomeni. Essa è dunque applica- 
bile sia al Web, in cui l'80% di link proviene dal 20% delle pagine, sia alla 
rete della comunicazione scientifica tradizionale, in cui, come osservava 
De Solla Price, l'80% citazioni proviene dal 20% degli scritti. 

6. Il Web è una rete a invarianza di scala, i cui nodi sono distribuiti 
secondo leggi di potenza in base a due principi: il principio della crescita 
(sempre nuovi nodi vengono aggiunti progressivamente nel tempo) e il 
principio del collegamento preferenziale (è un comportamento comune 
collegare le proprie pagine a pagine che hanno molti link, che sono cioè 
altamente connesse). 

A causa di tali caratteristiche e proprietà, dunque, il Web non forma 
una singola rete omogenea ed è costituito da numerosi “sottomondi’, in 
modo analogo a quanto avviene per la rete delle citazioni scientifiche. Il 
suo spazio è diviso in quattro continenti di dimensioni pressoché equiva- 
lenti come rappresentato in figura 3. 

Il primo è il “corpo centrale”, comprende circa il 25% delle pagine, ed 
è facile da navigare perché molto interconnesso. Esso contiene i grandi 
connettori come i motori di ricerca (primo tra tutti google) e i grandi siti 
altamente linkati e visitati (per fare alcuni esempi: Amazon.com, ebay, 
youtube) ed è la zona più visibile del Web. Il secondo, detto “continente 
in’, è più difficile da navigare poiché consente di muoversi verso il “corpo 
centrale” ma non viceversa (come accade al pesce in una nassa). Allo 
stesso modo, il terzo continente (detto “continente out”) è raggiungibile 
dai nodi del corpo centrale, ma una volta usciti da tale zona non ci sono 
link per tornare indietro (esso contiene prevalentemente siti aziendali o 
gli archivi dei quotidiani online). Il quarto continente è fatto di tentacoli 
e isole separati, gruppi di pagine collegate tra loro ma non al “corpo cen- 
trale”. Si osservi inoltre, per inciso, che il Web gode delle proprietà dei 


7 Usa questo paragone Vincenzo Letta nel suo In Google we trust. Storia, vizi e 
virtù di un motore di ricerca nordamericano, Tesi di laurea in etica della comunicazio- 
ne, Facoltà di Lettere e filosofia dell'Università di Pisa, 2008, <http://etd.adm.unipi.it/ 
/theses/available/etd-10132008-104502/>, p. 5. 
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frattali, vale a dire che, visto da lontano o da vicino, ha la medesima 
struttura?. 


Saat ( 
CO 


> 


Figura 3. I quattro continenti del Web 


Recenti studi hanno stimato che soltanto metà del Web è navigabile, 
cioè il “corpo centrale” e il “continente out”. Questa caratteristica è una 
sua proprietà topologica: vale a dire che la possibilità di trovare un per- 
corso tra due nodi è indipendente dalle capacità dell’uomo e dei migliori 
motori di ricerca, esistenti o possibili (proprio come a Kónigsberg). 

Non solo: la struttura che abbiamo descritto riguarda la parte visibile 
del Web, ma il Web è molto più vasto e più ricco. Esiste infatti un Web 
sommerso (deep Web) che è introvabile dai motori e dai crawler? (e che 
ad esempio contiene le pagine dinamiche create in risposta a una query 
su un database, o pagine accessibili tramite password), le cui dimensioni 
sono stimate essere tra le 400 e le 550 volte quelle del Web visibile”. 


8 Il frattale è un oggetto geometrico che si ripete nella sua struttura allo stesso 
modo su scale diverse (esempi di frattali in natura sono i fiocchi di neve, gli alberi, i 
cavolfiori). Per una definizione più completa ma divulgativa, si veda la voce di wiki- 
pedia all'URL <http://it.wikipedia.org/wiki/Frattale> (10/09). 

9Un crawler (detto anche spider o robot), è un software che analizza i contenuti di 
una rete (o di un database) in un modo metodico e automatizzato, in genere per con- 
to di un motore di ricerca. Cfr. <http://it-wikipedia.org/wiki/Crawler> (10/09). 

10 Cfr. I.H. Witten, M. Gori, T. Numerico, Web Dragons. Inside the Myths of Sear- 
ch Engine Technology, Morgan Kaufmann Publishers-Elsevier, San Francisco 2007, 
pp. 96-7. Il testo è un utilissimo strumento per la ricerca sul Web (assieme al sito 
Searchlores di Fravia <http://www.searchlores.org/>), ed è in buona parte comple- 
mentare a questo libro. L'impostazione filosofica alla base di Web Dragons ci sembra 
tuttavia differente dalla nostra, in quanto orientata da un approccio che si basa sulle 
teorie dell'intelligenza artificiale, da cui i sostenitori del Web semantico prendono in- 
vece le distanze. Un punto, questo, che sarà meglio approfondito nei futuri sviluppi di 
questa ricerca. 
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Ne fanno parte, per restare alla letteratura scientifica, anche le biblio- 
teche digitali e la cosiddetta “letteratura grigia” in cui rientrano tesi di 
laurea e di dottorato, rapporti, relazioni e presentazioni a convegni, saggi 
in attesa di accettazione da parte di riviste accademiche, cataloghi, ma- 
nuali di prodotti hardware e software, dispense universitarie!!. 

Si osservi dunque che essere online non significa, di per sé, essere vi- 
sibili. Il modo preferenziale in cui si naviga sul Web è attraverso i motori 
di ricerca, che però pescano i risultati solo all'interno del corpo centrale e 
nel continente out del Web “di superficie”. 

In che modo dunque i motori trovano le pagine sul Web? 

Google, il motore di ricerca più utilizzato nel mondo, è stato inventa- 
to da due giovani ricercatori di teoria dei grafi, Sergej Brin e Larry Page, 
mentre analizzavano le caratteristiche dei grafi orientati (i cui collega- 
menti, ricordiamo, sono unidirezionali). Brin e Page concentrano l'anali- 
si su un problema particolare: come tornare indietro in un grafo orienta- 
to, cioè come scoprire se un sito è stato linkato, e da chi. Nel secondo ca- 
pitolo si è detto che Berners-Lee, perso il suo primo programma Enquire 
che permetteva di costruire reti indirette con link bidirezionali, lo rico- 
struisce con link che vanno in una sola direzione. Brin e Page ne raccol- 
gono la sfida e danno vita a BackRub, letteralmente “massaggio alla 
schiena” che diventa poi PageRank, l'algoritmo che consente a Google di 
trovare le risorse sfruttando questo limite architettonico del Web e tra- 
sformandolo in una ricchezza". All'origine della loro invenzione sta l'in- 
tenzione di scandagliare il Web, impresa in cui, come ricorda Barabási, 
non sono gli unici a cimentarsi. Page decide di farlo cercando di capire 
dove è possibile arrivare a partire da una pagina, e poi invertendo la dire- 
zione. 


Adesso aveva chiara una nuova teoria: conteggiare il numero di link 
che puntava a un sito Web voleva dire misurare la popolarità di quel 
sito e si accorse subito che, da questo punto di vista, il link assomi- 
gliava a un altro concetto che viveva dentro il mondo accademico, la 
citazione. Essa costituiva il criterio base utilizzato nel sistema di valu- 
tazione delle pubblicazioni universitarie. Al mero criterio quantitati- 
vo ebbe modo così di capire che si poteva aggiungerne anche uno di 
autorevolezza. Ma se anche al link di provenienza doveva essere ap- 
plicato lo stesso criterio per valutarne l'importanza, la cosa costituiva 
una difficile sfida di matematica ricorsiva. I calcoli diventavano com- 
plicati e si ingigantivano a dismisura”. 


11 Cfr. F. Metitieri, R. Ridi, Biblioteche in rete. Istruzioni per l'uso, Laterza, Roma- 
Bari 2005, in part. Capitolo 10, <http://www.laterza.it/bibliotecheinrete/Cap10/Ca- 
p10_10.htm>. 

12 S. Brin, L. Page, The Anatomy of a Large-Scale Hypertextual. Web Search Engi- 
ne, 2000, <http://infolab.stanford.edu/~backrub/google.html>. 
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Il giovane dottorando americano affronta lo stesso problema fronteg- 
giato da Eugene Garfield pochi decenni prima, ma con una difficoltà in 
più, che lo rende a prima vista irrisolvibile. Lo spazio del Web, a differen- 
za del database dello Science Citation Index, è aperto e in continua cresci- 
ta. Così, assieme a Brin, Page crea un sistema per valutare la popolarità 
di un sito, incrociando criteri quantitativi e criteri di autorevolezza, cioè 
pesando i link sulla base della loro importanza. In breve, Google identifi- 
ca la posizione di un nodo nel grafo e privilegia, nelle risposte alle query, 
le grandi autorità e i grandi connettori. Ad esempio, è intuitivo che se la 
mia pagina personale viene linkata da quella di un sito di un mio collega, 
secondo Google l'importanza di quel collegamento è minore rispetto a 
quella di un link dal sito di repubblica.it, anche se il ricercatore che mi 
cita è uno scienziato illustre. Dunque ci sono link che pesano più di altri 
in termini di popolarità. In una riflessione sulla comunicazione scientifi- 
ca non deve tuttavia sfuggirci che questo tipo di peso non necessaria- 
mente misura il valore scientifico del collegamento. 

Riprenderemo questo argomento nel prossimo capitolo. Basti qui sot- 
tolineare che PageRank, pur agendo sull'architettura del Web, ne altera 
alcune caratteristiche. In primo luogo, sfrutta la possibilità di percorrere 
i link a ritroso, trasformando il nucleo centrale di un grafo orientato in 
una rete indiretta. Ma c'è un punto ulteriore, forse ancora più rilevante. 
L'algoritmo di Google è proprietario e segreto — a differenza delle tecno- 
logie grazie alle quali il Web è nato e si è sviluppato, che sono aperte e di 
pubblico dominio. 


2. Oltre i limiti del Web: il Web semantico 


Sappiamo dunque che è possibile navigare soltanto in una frazione 
del Web, vale a dire che la maggior parte delle sue pagine può essere rin- 
tracciata soltanto conoscendone l'indirizzo (URL o URI) e che solo una 
minima parte di esse è raggiungibile a partire da altri nodi della ragnate- 
la. Ma come giungiamo a un sito che ci interessa? Abbiamo visto che lo 
strumento essenziale a reperire le informazioni contenute nelle pagine 
Web sono i motori di ricerca. Digitando una o più parole su Google, il 
sito di Google ci restituisce un elenco di link a pagine che contengono 
informazioni pertinenti ai fini della nostra ricerca. Tuttavia, non sempre 
le informazioni che troviamo corrispondono a quanto cerchiamo; vice- 
versa, di solito la parte maggiore dei risultati è decisamente “fuori tema”. 
Infatti, se i motori di ricerca si sono dimostrati utilissimi nel setacciare 
rapidamente un numero molto elevato di pagine, non si rivelano altret- 
tanto utili nel valutare la qualità del documento. Assieme a informazioni 


13 V. Letta, In Google we trust. Storia, vizi e virtù di un motore di ricerca nordame- 
ricano, cit. p. 16. 
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rilevanti, i motori ci restituiscono moltissimi link a pagine il cui conte- 
nuto è estraneo a quanto cerchiamo. Un problema che non dipende dalle 
caratteristiche topologiche della rete, ma da un suo limite architettonico. 

In pratica, le difficoltà che incontrano i motori di ricerca dipendono 
dal fatto che questi si limitano a controllare la presenza nei documenti di 
determinati termini (parole chiave), un indizio che dice molto poco sul 
reale contenuto delle pagine che troviamo". Perché dunque non si inve- 
ste nel migliorare le tecniche e gli algoritmi di ricerca? In parte, lo si fa. 
Tuttavia, l'architettura originaria del Web presenta alcuni limiti che non 
dipendono da un difetto negli algoritmi di ricerca utilizzati dai motori. Il 
limite principale consiste piuttosto nel fatto che, sul Web, le diverse in- 
formazioni di un documento HTML sono mescolate al suo interno e non 
sono strutturate semanticamente, rendendo impossibile alle macchine 
trattare i dati sparsi nelle pagine secondo il significato che attribuiamo 
loro nel contesto in cui sono inseriti - mentre il significato dei dati all'in- 
terno del contesto é essenziale in qualsiasi ricerca. 

Prendiamo ad esempio il caso in cui io decida di vendere la mia auto- 
mobile tramite un annuncio in rete. L'annuncio che decido di postare in 
una pagina Web è più o meno del tipo “Vendo Toyota Yaris nera, ottimo 
stato, buon prezzo, Pisa, Italia”. Tuttavia, se cerco “Yaris nera in vendita a 
Pisa, Italia) i motori di ricerca mi restituiranno un elenco sterminato di 
pagine che contengono quelle parole, ma il cui contenuto, nella maggior 
parte dei casi, sarà molto lontano da quello che desidero, informazione 
che viene definita noise, “chiasso”, poiché distoglie la mia attenzione dai 
risultati che effettivamente mi interessano. Otterró invece risultati mi- 
gliori decidendo di inserire la mia offerta in un sito specializzato che 
contiene un modulo i cui campi di ricerca siano predefiniti e indichino, 
ad esempio, la casa automobilistica, il modello, l'anno di immatricolazio- 
ne dell'auto e altri dati rilevanti ai fini della ricerca. Questo perché la pa- 
gina è scritta in un formato leggibile da una macchina, la quale sarà in 
grado di identificare e conservare il significato delle singole parti del do- 
cumento. 

Nel processo di ricerca non conta soltanto trovare la risposta a una 
domanda; ad assumere un rilievo fondamentale sono le strutture in cui é 
inserita la singola informazione. Il progetto originario del Web prevede- 
va in effetti che tali strutture fossero in qualche modo visibili e rintrac- 
ciabili tanto dagli umani quanto dai computer". Viceversa, sul Web come 


14 T. Berners-Lee, L'architettura del nuovo Web, cit., p. 155. 

15 Si osservi con attenzione la figura 1 nella prima proposta presentata da Ber- 
ners-Lee al CERN (Information Management: A proposal, marzo 1989-maggio 1990, 
«http://www.w3.org/History/1989/proposal.html»). Nella figura, gli archi che colle- 
gano le singole pagine (e che corrispondono ai link) sono contrassegnati da "etichet- 
te" che definiscono il tipo di collegamento che esiste tra due risorse. I tipi di collega- 
mento possono essere diversi: ad esempio “Tim Berners-Lee" “ha scritto” “questo do- 
cumento”. “Questo documento” “descrive” "l'ipertesto" Le relazioni “ha scritto" e “de- 
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è stato implementato e come lo conosciamo, i link non sono “etichettati”. 
Questa caratteristica ne indebolisce le potenzialità. 

Dal 1999 il World Wide Web Consortium (W3C)'5, il consorzio fon- 
dato e diretto da Tim Berners-Lee allo scopo di promuovere standard 
che assicurino l'interoperabilità del Web, ha concentrato le ricerche sui 
modi in cui risolvere il problema, dando vita a un orientamento noto 
come Web semantico”. Scopo di tale orientamento è progettare e svilup- 
pare una estensione del Web che lo trasformi in una ragnatela di dati ela- 
borabili dalle macchine. La scommessa fatta propria dal W3C è far di- 
ventare la rete in grado di interpretare le nostre richieste. Il web diviene 
semantico nel momento in cui, nella rete di collegamenti tra dati di natu- 
ra differente ed espressi in forma diversa, i computer diventano in grado 
di trattare i dati in modo da inferire nuova conoscenza a partire da quel- 
la nota. Da un punto di vista tecnico, ciò è possibile strutturando l'infor- 
mazione in modo tale che i documenti non restino “isole di dati” ma di- 
ventino “data base aperti” da cui un programma possa attingere informa- 
zioni. 

Per comprendere il senso di tale affermazione, è utile introdurre la 
differenza tra “information retrieval" (recupero di informazione) e “data 
retrieval" (risposta automatizzata alle domande). Obiettivo della prima è 
produrre documenti che sono rilevanti per una query; questi documenti 
non devono essere unici, e interrogazioni successive possono dare luogo 
a risultati completamente diversi. Obiettivo del secondo è invece produr- 
re la risposta corretta a una domanda. Il Web semantico si occupa di 
quest'ultimo aspetto!. Ma che cosa significa Web semantico, in pratica? 
E come ci apparirà il nuovo Web? Una prima risposta si trova nell'esem- 
pio che segue: 


Quando il telefono squillò, il sistema di intrattenimento stava cantan- 
do a squarciagola “We Can Work It Out” dei Beatles. Nel momento in 
cui Pete alzò la cornetta, il suo telefono abbassò il volume mandando 
un messaggio a tutti i dispositivi locali con un controllo del volume. 
All'altro capo della linea c'era sua sorella, Lucy, dallo studio medico: 
“la mamma ha bisogno di una visita specialistica e poi dovrà eseguire 
una serie di trattamenti. Due volte a settimana, o giù di lì. Ora chiedo 
al mio agente di fissare gli appuntamenti”. Pete accettò subito di con- 
dividere l'impegno. 


scrive” si traducono banalmente in link. Ma sono link dal significato diverso; un si- 
gnificato che, nell'idea originaria di Web, veniva esplicitato. 

16 Il sito del W3C è all'URL <http://www.w3.org>. 

17 Si veda in particolare questa sezione del sito del W3C «http://www.w3.org/ 
2001/sw/». 

18 T. Berners-Lee, W. Hall, J.A. Hendler, K. O'Hara, N. Shadbolt and D.J. Weitz- 
ner, A Framework for Web Science, cit., p. 18. 
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Dallo studio del medico, Lucy istruì il suo agente semantico attraver- 
so il browser del suo palmare. L'agente di Lucy trovò immediatamen- 
te dall'agente del medico le informazioni relative al trattamento pre- 
scritto, controllò diverse liste di offerte e controllò quelle che rientra- 
vano nel piano assicurativo della madre nel raggio di 20 miglia da casa 
sua, e con un rating di fiducia eccellente o molto buono. Poi l'agente 
cominciò a provare a cercare gli appuntamenti liberi (offerti dagli 
agenti dei singoli provider tramite i loro siti Web) compatibili con le 
disponibilità di Lucy e di Pete (le parole in corsivo indicano i termini 
la cui semantica, o significato, vengono definiti per gli agenti attraver- 
so il Web semantico). 

In pochi minuti, l'agente presentò loro un programma. Pete non lo 
apprezzò. Lo University Hospital si trovava dalla parte opposta della 
città rispetto alla casa della madre, e avrebbe dovuto tornare indietro 
nel caos del traffico dell'ora di punta. Programmò il suo agente in 
modo da rifare la ricerca con preferenza più strette su luogo e orario. 
L'agente di Lucy, avendo completa fiducia in quello di Pete riguardo a 
questa specifica ricerca, fornì a quello assistenza immediata fornen- 
dogli l'accesso ai certificati e agli shortcut dei dati che aveva trovato. 
Quasi istantaneamente fu presentato un nuovo programma: la clinica 
era molto più vicina e gli orari anticipati, ma c'erano due avvisi. In 
primo luogo, Pete avrebbe dovuto spostare due appuntamenti poco 
importanti. Controllò di che cosa si trattava, e vide che non era un 
problema. L'altro riguardava il fatto che la clinica non rientrava nel- 
l'elenco di terapeuti coperti dalla compagnia di assicurazione: l'agente 
lo rassicurò “Servizio coperto e piano assicurativo verificato sicuro da 
altri mezzi” “(Dettagli?)” 

Lucy si rese assente nello stesso istante in cui Pete brontolava: “rispar- 
miami i dettagli” e tutto fu risolto”. 


Abbiamo osservato come, da un punto di vista tecnico, l'architettura 
originale del Web si basasse esclusivamente su tre principi semplici: URL 
(la possibilità di puntare a una risorsa dandole un nome dal significato 
univoco), HTTP (il protocollo di trasporto delle pagine sul Web) e 
HTML (il linguaggio di codifica delle pagine Web, che permette di inse- 
rire link). Per far sì che i computer possano essere in grado di eseguire 
compiti come quello descritto, si sono rese necessarie alcune trasforma- 
zioni nell'architettura del Web. Che cosa significa strutturare semantica- 
mente l'informazione? E come si può farlo? 

È possibile costruire una risposta a entrambe le domande consideran- 
do da vicino le trasformazioni tecnologiche sulle quali si fonda il Web se- 
mantico, oggi detto anche Web dei dati. Da un punto di vista architetto- 


19 T. Berners-Lee, J. Hendler, O. Lassila, The Semantic Web. A new form of Web 
content that is meaningful to computers will unleash a revolution of new possibilities, 
«Scientific American Magazine», 2001, <http://www.sciam.com/article.cfm?arti- 
cleID=00048144-10D2-1C70-84A9809EC588EF21>. 
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nico, il Web semantico è stato rappresentato nel 2001 da Tim Berners- 
Lee? come una piramide di sette strati e composta da nove elementi, una 
piramide che “sorregge” tre tipologie di informazioni (“documenti auto- 
descrittivi”, “dati” e “regole”). 


Rules Trust 


Logic 


Data 


Data 


Self- 
desc. 
doc. 


Ontology vocabulary 


Digital Signature 


RDF + rdfschema 


Unicode 


Figura 4. Semantic web Layers Cake 


Il significato della nuova architettura dev'essere spiegato a partire dal- 
la base della piramide. Gli elementi in basso sorreggono gli strati più alti, 
e ne sono una precondizione. Infatti, il rapporto tra un piano della pira- 
mide e quello successivo può essere interpretato come un rapporto di 
condizionamento inteso in senso kantiano, vale a dire che il web può es- 
sere concepito come un insieme di strati con standard, linguaggi o proto- 
colli che agiscono come piattaforme sulle quali possono poggiarsi forma- 
lismi nuovi, più ricchi e più espressivi. Piattaforme che sono intese più 
neutrali possibile, in cui l'architettura a strati ha funzione di regolamen- 
tazione e non è prescrittiva?! Un'analogia che può aiutare a comprendere 
il tipo di rapporto che esiste tra i sette strati della “torta semantica” è 
quella con il funzionamento di un aeroporto, dove la partenza e l'arrivo 


20 La slide è disponibile online all'URL <http://www.w3.0rg/2000/Talks/1206- 
xml2k-tbl/slide10-0.html>. 

21 Gli studiosi di Web science sostengono che il rapporto tra gli strati si possa de- 
finire come supervenienza, termine che in filosofia indica un modo per spiegare la ge- 
nerazione di significati per cui un discorso A è superveniente a un discorso B se un 
cambiamento in A comporta un cambiamento in B, ma non viceversa. T. Berners- 
Lee, W. Hall, J.A. Hendler, K. O'Hara, N. Shadbolt and D.J. Weitzner, A Framework 
for Web Science, cit., p. 72. 
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di ogni aereo dipendono dalla corretta concatenazione ed esecuzione di 
una serie di procedure standard (dal check-in dei passeggeri al loro sbar- 
co, dalla spedizione alla riconsegna dei bagagli, dalle fasi di decollo e di 
atterraggio, seguite dai piloti e monitorate dalle torri di controllo, etc...). 

È inoltre importante osservare che, nel passaggio dagli strati inferiori 
a quelli superiori (in particolare gli ultimi due, “Proof” e “Trust”), le in- 
novazioni che sono introdotte sono poco definite sul piano tecnologico. 
Ciò che viene invece illustrato è piuttosto l'impatto socio-culturale che le 
trasformazioni in atto nell'architettura del Web saranno in grado di pro- 
durre nelle comunità che operano sul Web, un aspetto di particolare in- 
teresse ai fini del nostro discorso. 

Un'analisi dettagliata dell'architettura del Web semantico esula dallo 
scopo di questo contributo. Qui ci limitiamo a riassumere gli aspetti es- 
senziali delle innovazioni tecnologiche proposte, che possiamo concen- 
trare in quattro punti: 

a ) Metadati (“dati sui dati”): servono a descrivere o annotare una ri- 
sorsa in modo da renderla maggiormente comprensibile agli utenti. Nor- 
malmente i metadati sono di natura descrittiva e includono informazioni 
relative a un documento tra cui ad esempio l'autore, il titolo o l'abstract, 
il tipo di file, i diritti d'accesso o il numero di versione. L'aggiunta di dati 
sui dati è utile per organizzare le risorse, per l'archiviazione e per identi- 
ficare l'informazione. I metadati sono dunque una nuova forma di cata- 
logazione, che può essere inserita nei documenti digitali. 


Uno schema di metadati può essere creato da chiunque, a seconda 
della natura dei propri documenti e dell'uso che si prevede di farne. 
Esistono infatti schemi di metadati sviluppati per particolari settori, 
come i testi letterari (TEI), le informazioni geospaziali (NSDI), gli 
stessi cataloghi bibliografici (MARC)”. 


Tuttavia, la funzione più importante dei metadati è promuovere l'in- 
teroperabilità, consentendo la combinazione di risorse eterogenee tra 
piattaforme diverse senza perdere informazioni rilevanti. Schemi di 
metadati per il Web sono ad esempio quelli della Dublin Core Metadata 
Initiative, un sistema costituito da un nucleo di 15 elementi essenziali ai 


22 C. Gnoli, V. Marino, L. Rosati, Organizzare la conoscenza. Dalle biblioteche al- 
l'architettura dell'informazione, cit., p. 60. 

23 Per l'uso di chi naviga sul Web, i metadati possono essere non-strutturati; vice - 
versa, per essere comprensibili alle macchine è necessario che tali informazioni siano 
strutturate. RDF offre meccanismi per integrare schemi di metadati. Cfr. T. Berners- 
Lee, W. Hall, J.A. Hendler, K. O'Hara, N. Shadbolt and D.J. Weitzner, A Framework 
for Web Science, cit., pp. 36-39. 
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fini della descrizione di qualsiasi materiale digitale accessibile tramite la 
rete? 

Si parla dunque di “open data” per definire un'importante caratteristi- 
ca del web semantico, cioé la disponibilità dei dati e la conseguente pos- 
sibilità di identificarli e citarli. Il Web semantico è perciò un'estensione 
del Web tradizionale nel senso che è il successivo passaggio nel linking 
ed è pensato per funzionare nel contesto di un modello relazionale di 
dati, in cui il link, da collegamento generico e cieco tra due documenti, 
diviene capace di esprimere relazioni concettuali, che convogliano signi- 
ficati. In pratica, sul Web ogni “dato”, ogni pezzetto di informazione, vie- 
ne identificato da un URI. Perciò, si usa dire che sul web semantico tutto 
è un URI. 

b) Gli URI (identificatori di dati) vengono messi in relazione tra loro 
tramite il linguaggio Resource Description Framework (RDF), che con- 
sente di costruire asserzioni tramite triple formate da soggetto predicato 
e oggetto e di collegare tra loro le triple in un unico grafo (in cui soggetto 
e oggetto sono nodi, URI, e il predicato è il link). Si vedano le figure che 
seguono, per un esempio. La prima (figura 5) mostra come si costruisco- 
no le triple. 


Dati: Triple che formano un grafo 


Soggetto Predicato Oggetto 
Mario è amico di Maria 
isbn#21837 dc:title "| Promessi Sposi" 
Mario ha letto isbn#21837 


Figura 5. Costruzione di triple soggetto > predicato > oggetto 


La seconda (figura 6) mostra come si costruiscono grafi con RDF. 


24 I metadati Dublin Core <http://dublincore.org/> comprendono Title, Creator, 
Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, 
Language, Relation, Coverage e Rights. 
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http://en.wikipedia.org/wiki/lucca http://vocabolario.xxx/termini#citta 


is a 


nato a http://compositoriitaliani.it/puccini 


Giacomo 


we foaf:surname 
Puccini 


Figura 6. Grafi in RDF 


c) Per esplicitare in modo formale un determinato campo di cono- 
scenze, é necessario un ulteriore passaggio che permetta di associare i 
concetti a regole logiche d'uso. Questo compito é assegnato alle ontolo- 
gie. In filosofia, un'ontologia è una teoria sulla natura dell'essere di tipi di 
oggetti; in senso più tecnico, è un accordo che si basa su definizioni con- 
divise e che rappresenta la base concettuale su cui operiamo. Il termine è 
diventato di uso comune tra i ricercatori che si occupano di intelligenza 
artificiale e del Web, e in questo significato l'ontologia è un documento 
che definisce in modo formale le relazioni tra termini”. Nel grafo della 
figura sopra è già presente un'ontologia. Si tratta del link “is_a” tra “luc- 
ca” e “città” “is_a” è in effetti una relazione che fa parte dei mattoni per 
creare un'ontologia. Relazioni come “is_a” sono in un certo senso prede- 
finite: sono gli assiomi del linguaggio, i connettori logici. 

La tipica ontologia per il Web ha una tassonomia e un insieme di re- 
gole di inferenza. La tassonomia definisce classi di oggetti e le relazioni 
tra essi. Così, il significato dei termini in una pagina web può essere sta- 
bilito da puntatori che linkano a un'ontologia. Un agente semantico che 
cerchi l'ospedale di Pisa e trovi “Santa Chiara” deve poter capire che non 
cerchiamo una biografia di Santa Chiara, né una chiesa o una Chiara 
qualunque. L'ontologia è un albero che permette di esprimere restrizioni 
sui termini (condizioni), quindi relazioni. Attraverso le relazioni della lo- 
gica descrittiva si può esprimere in maniera formale qualsiasi oggetto o 
concetto. Le ontologie dunque contengono le specifiche dei concetti ne- 
cessari a comprendere un dominio di conoscenza, il vocabolario corri- 


25 Nel campo delle “computational ontologies”, si parla di ontologie con due acce- 
zioni diverse, entrambe corrette. La prima accezione intende con ontologia l'insieme 
sia dei dati, sia dei vocabolari; nella seconda accezione, l'ontologia è l'insieme dei soli 
vocabolari. In logica descrittiva si fa distinzione tra Abox e Tbox come due compo- 
nenti distinti delle ontologie. La Tbox definisce un vocabolario e le relazioni tra gli 
elementi del vocabolario, la Abox è un insieme di asserzioni compatibili con quanto 
definito dalla Tbox. Qui intendiamo l'ontologia nella seconda accezione. 
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spondente, e il modo in cui concetti e vocabolari sono collegati e in cui 
sono definite e descritte le classi, le istanze e le loro proprietà”. 

Un'ontologia può essere formale o informale. Il vantaggio di un'onto- 
logia formalizzata risiede nel fatto che questa è machine-readable, vale a 
dire che un computer può compiere dei ragionamenti a partire da essa. 
Di contro, lo svantaggio sta nella difficoltà di implementare tali costrutti 
formali. 

È intuitivo osservare che due basi di dati possono usare identificatori 
differenti per il medesimo concetto. Un programma che voglia confron- 
tare o combinare informazioni nei due database deve sapere che più ter- 
mini possono riferirsi al medesimo oggetto. Idealmente, il programma 
deve essere in grado di riconoscere due termini come sinonimi. La solu- 
zione a questo problema è data dalle altre ontologie?” — le quali debbono 
mettere in correlazione i dati usando una lingua franca in modo da faci- 
litarne la condivisione. Si veda nella figura sotto un esempio. 


Web dei dati 


ArteAlucca.com chieseditalia.com 
| 0 | nome [rocana | nec | 
soi 


geografialtalia.com 


Eg — 
nascita 
Duomo di 
San Martino Lucca 22/12/1858 


| 55100 | Lucca | 3249784| 34322 


compositori.com 


Luogo Data 


Nome Nascita nascita 


Giacomo 


via Lucca 22/12/1858 
Puccini 


Figura 7. Esempio di incrocio di dati da basi di dati distinte. 


26 T. Gruber, A translation approach to formal ontologies, «Knowledge Acquisi- 
tion», 5, 25, 1993, pp. 199-200, «http://ksl-web.stanford.edu/KSLAbstracts/KSL-92- 
71.html». 

27 Le ontologie sono scritte in RDF Schema, Onthology Web Language (OWL), e 
in altri linguaggi appositi, ad esempio DAML, DAMOIL. 
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Sul piano dell'implementazione, l'ontologia esistente più diffusa è 
Wordnet, che descrive i concetti (sinonimi, contrari, relazioni tra concet- 
ti) in diverse lingue. La peculiarità di tale sistema è che è in grado di eff- 
ettuare ricerche di “dipendenza concettuale”, come ad esempio le relazio- 
ni meronimiche (parte-tutto), sineddotiche o metonimiche (per esem- 
pio, se cerco un ospedale nella città di Lucca, è essenziale che il sistema 
sappia in qualche modo che Lucca è in Toscana e che la Toscana si trova 
in Italia). 

Si osservi che chiunque può creare un propria ontologia di riferimen- 
to (sperando che venga condivisa) o adottarne una esistente, optando 
così per una altrui prospettiva. In genere, le ontologie sono create all'in- 
terno di comunità di conoscenza. Un problema, riscontrato e segnalato 
in particolare dai filosofi, è che ciascuno definisce il mondo a suo piaci- 
mento, e che proprio la creazione di queste definizioni è parte integrante 
del mestiere del ricercatore in scienze umane e sociali. Dunque, esiste un 
alto rischio di creare sistemi che si sovrappongono o che sono in conflit- 
to, mentre la ricerca di un'unica ontologia, se da una parte sarebbe auspi- 
cabile, può comportare il pericolo insito nella rigidità delle interpretazio- 
ni di fatti e fenomeni. 

Tuttavia, tale limite o pericolo può diventare una ricchezza. È infatti 
auspicabile che vengano create molte e diverse ontologie, poiché più si- 
stemi di classificazione sono in grado di stabilire una più corrispondenze 
tra nomi e oggetti di quanto non possa fare un unico vocabolario; inol- 
tre, è possibile creare meta-ontologie che stabiliscano corrispondenze tra 
sinonimi, e che mettano a loro volta in relazione vocabolari distinti. On- 
tologie diverse possono essere intersecate in modo da stabilire analogie, 
cioè relazioni di equivalenza. Spesso, gruppi diversi elaborano indipen- 
dentemente concetti molto simili e descrivere la relazione che esiste tra 
questi porta grandi benefici. Per un software, potrà essere dunque nor- 
male avere a che fare con ontologie differenti e magari in parte conflit- 
tuali nello stesso dominio di conoscenza, e sarà un compito del program- 
ma stesso mostrarne le diversità, aiutando così a migliorare la compren- 
sione del concetto in questione. 

Un'altra garanzia di pluralità, per la quale i teorici del web semantico 
si distinguono dalle teorie dell'intelligenza artificiale, è data dalle impli- 
cazioni della cosiddetta “Open World Assumption’, secondo la quale il va- 
lore di verità di un'asserzione è indipendente dalle conoscenze dell'osser- 
vatore. Per fare un esempio, se la mia asserzione è “Francesca” “è” “italia- 
na’, la risposta alla domanda: Paolo è italiano? Sarà: non lo so. I linguaggi 
RDF e OWL si basano su questo assunto della logica formale. L'assenza 
di una particolare affermazione sul web significa semplicemente, in prin- 
cipio, che non è stata ancora esplicitata, al di là del fatto che possa essere 
vera o falsa e dalle credenze dell'osservatore in merito. In altre parole, 
questo significa che se un osservatore non sa se un'asserzione è vera non 
può inferire che essa sia falsa (come invece accadrebbe in un mondo in 
cui vale la “Closed World Assumption’). 
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L'unione dei dati espressi in RDF e dei dati espressi in un linguaggio 
delle ontologie (ad esempio OWL) permette di inferire nuova conoscen- 
za. È questo lo strato della logica, in cui trova spazio il “reasoning”, l'infe- 
renza di nuova conoscenza: per costruire procedure analoghe al ragiona- 
mento software appositi devono essere in grado di collegare i termini, 
una funzione che sarà resa possibile tramite i linguaggi di inferenza. I 
linguaggi di inferenza consentono alle macchine di convertire dati da un 
formato all'altro, riconoscendo due termini come identici e traducendoli, 
un po' come fa un dizionario bilingue. Si tratta di una funzione fonda- 
mentale poiché nessuno ha il potere di definire un termine per tutti; que- 
sti linguaggi si occupano pertanto di identificare relazioni tra basi di dati 
per stabilire la presenza di sinonimi. Per tornare all'esempio di Lucy e 
Pete alla ricerca di un medico per il trattamento prescritto alla madre, 
grazie ai linguaggi di inferenza potrà essere trovato l'ospedale giusto an- 
che usando i termini “clinica”, “casa di cura" o “hospital”, e via dicendo. 
Questa specifica funzione è assegnata a motori di ricerca logici, motori 
in grado di applicare le regole della logica per stabilire se le risposte otte- 
nute in una ricerca iniziale sono utili o no. Nell'esempio, è un motore che 
riesca a rintracciare le informazioni relative alla loro specifica richiesta e 
a combinare i criteri da loro definiti: il trattamento richiesto e la copertu- 
ra assicurativa dell'assistita, la distanza dalle rispettive abitazioni, gli ora- 
ri in cui si sono resi disponibili, e altre informazioni rilevanti. 

d) Infine, un concetto essenziale è quello di fiducia (Trust). 


La rete di fiducia è un modello essenziale del modo in cui lavoriamo 
realmente come persone. Ognuno di noi costruisce la sua rete sin dal- 
l'infanzia. Man mano che decidiamo cosa linkare, cosa leggere o com- 
prare sul web, un elemento che entra a far parte della nostra decisione 
è quanto possiamo fidarci dell'informazione che vediamo. Potremo fi- 
darci del nome dell'editore, delle pratiche di tutela della privacy, delle 
motivazioni politiche? Certe volte impariamo nel modo peggiore che 
non dobbiamo fidarci, ma più spesso ereditiamo la fiducia da altri, da 
un amico o da un insegnante o da un familiare, o da raccomandazio- 
ni edite oppure da garanzie di terzi come la banca o il dottore.?8 


La costruzione di reti di fiducia è necessaria a implementare sistemi 
di filtro dell'informazione secondo criteri di qualità condivisi ma sogget- 
tivi, ed è uno dei temi su cui discute da anni il W3C”. In particolare, sul 
Web il concetto di fiducia assume notevole importanza da un punto di 
vista socio-culturale, sul piano cioè della trasformazione dei comporta- 
menti dei navigatori della rete. La qualità e la rilevanza di una pagina di- 
pendono da come viene percepita da parte di un lettore, elementi che di- 


28 T. Berners-Lee, L'architettura del nuovo Web, cit., pp. 137-38. 
29 Ivi, pp. 134-37. 
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pendono da una serie di credenze soggettive. Sono queste credenze sog- 
gettive a rientrare nella nozione di fiducia (Trust). La fiducia è un impor- 
tante fattore nello sviluppo del Web, in particolare per quanto riguarda 
l'uso del Web come mezzo di comunicazione scientifica, visto che l'archi- 
tettura del Web, e in particolare l'assenza di un'autorità centralizzata, 
consente l'anonimato e non impedisce la copia. Tuttavia, studiare come si 
costruisce la fiducia online è particolarmente difficile a causa di diversi 
fattori: i molteplici contesti in cui si svolgono le interazioni; il fatto che la 
fiducia in un sistema e in un individuo vengano assimilate; infine, gli stu- 
di empirici, per quanto rigorosi e ben condotti, presentano definizioni 
diverse del termine, rendendo pressoché impossibile una comparazione. 
Inoltre la fiducia non è un fenomeno statico ma dinamico: spesso la fidu- 
cia in un sito viene costruita nell'arco del tempo, rendendo difficile quan- 
tificarla nel breve periodo; abbiamo visto che l'Impact Factor si calcola su 
un arco di tempo di due anni, ma sul Web due anni sono un periodo bre- 
ve, e del tutto arbitrario. Infine, utenti con diversi livelli di esperienza 
esprimono livelli di fiducia tipicamente differenti. Tutto ciò implica che 
la fiducia non possa essere prodotta semplicemente creando lo strumen- 
to e la tecnologia giusta. Ad esempio, qual è il giusto compromesso fra 
un sistema molto efficiente e costoso, e uno più scarno e meno efficiente, 
ma più economico e facile da usare? È necessario riflettere su questi 
aspetti da un punto di vista tecnico, ma anche filosofico e politico. 

Su un piano individuale, si tende ad affidarsi a meccanismi di feed- 
back sul comportamento, tramite cui un utente acquisisce una certa re- 
putazione. La reputazione è un elemento chiave per la fiducia. 

Per capire come aggregare e come valutare le reputazioni, bisogna 
porre alcune questioni preliminari: «Quali metodi renderanno possibile 
la raccolta di rating che definiscano l'affidabilità di un utente Web? Come 
dovrebbero essere aggregati tali rating? Come dovremmo ragionare su 
queste aggregazioni? E in che modo queste dovrebbero essere rese pub- 
bliche?»*° 

Il sistema di eBay, in cui i rating sono valori +1 o —1 a cui si aggiun- 
gono annotazioni testuali è l'esempio più noto di costruzione della repu- 
tazione. Nonostante la sua affidabilità non sia inquestionabile, il suo suc- 
cesso dimostra, nei fatti, l'efficacia di tale meccanismo. Tuttavia, in cam- 
po scientifico tale sistema si rivelerebbe in qualche misura povero e 
inefficace, in quanto il campo scientifico è composto da moltissime co- 
munità piccole (nicchie), e sui piccoli numeri le distorsioni introdotte da 
giudizi poco motivati o ingiusti sarebbero difficilmente ovviabili. Le di- 
verse dimensioni delle comunità richiedono pertanto di pensare sistemi 
differenti. 


30 Cfr. T. Berners-Lee, W. Hall, J.A. Hendler, K. O'Hara, N. Shadbolt and DJ. 
Weitzner, A Framework for Web Science, cit., p. 89, e in generale, si vedano le pp. 88- 
94. 
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Una questione complessa, collegata alla precedente, è quella di trova- 
re metriche adeguate a misurare la fiducia per i rating individuali, e algo- 
ritmi adeguati a creare aggregazioni. La valutazione delle metriche della 
fiducia è inevitabilmente difficile anche se non impossibile a patto che 
esista un contesto sufficiente a rendere la valutazione significativa. In al- 
cuni casi, le metriche quantitative sono dunque inappropriate. Per esem- 
pio, nel valutare una fonte di informazione, può accadere che l'utente ab- 
bia bisogno di confrontare le annotazioni e le analisi degli altri, più che 
affidarsi a un voto, o a una media di voti. Tuttavia, in campi compatti e li- 
mitati, il mark-up semantico dei documenti potrebbe rivelarsi un ottimo 
metodo per valutare l'affidabilità e la qualità di un documento. Resta co- 
munque il fatto che un ampio numero di giudizi di esperti, indipenden- 
temente dal modo in cui sono raccolti, rappresentati o aggregati, è essen- 
ziale a sviluppare un sistema di riconoscimento di fiducia durevole e affi- 
dabile. L'architettura del Web, e la facilità con cui è possibile linkare nuo- 
va informazione a quella esistente, permette la costruzione della fiducia 
in modo semplice. Applicazioni che sfruttano tali potenzialità stanno co- 
minciando a emergere; tra queste, vale la pena ricordare FOAF*, acroni- 
mo di Friend Of A Friend, un'ontologia basata su RDF/OWL che descri- 
ve le relazioni di un individuo con i suoi amici. 

Capire come informazioni sulla fiducia, la credibilità, l'attendibilità e 
la qualità di un documento possano essere estratte dalla struttura del 
Web è un tema centrale nello studio dei social network. Ricerche su que- 
sto tema potrebbero anche essere usate come metodo per fare una classi- 
fica delle pagine nelle ricerche sul web. Le tecniche di generazione di fi- 
ducia potrebbero avere sul Web semantico un ruolo simile a quello che 
algoritmi come PageRank hanno sul Web tradizionale. Un campo essen- 
ziale per la valutazione della ricerca scientifica, come vedremo nel pros- 
simo capitolo. 

La rete semantica è dunque in grado di descrivere l'informazione, poi 
di dedurre nuova conoscenza e infine di ragionare a partire da essa. È 
questo, in sintesi, il sistema necessario a far funzionare i nostri agenti se- 
mantici nella storia di Lucy e Pete. 


Quando migliaia di moduli saranno collegati in tutto il campo “co- 
gnomi”, allora tutti quelli che analizzeranno il Web capiranno che è 
un importante concetto comune. La cosa bella è che nessuno dovrà 
compiere realmente questa analisi. Il concetto di “cognome” comince- 
rà semplicemente a emergere come caratteristica importante di una 
persona. Come un bambino che impara un'idea tramite contatti ripe- 
tuti, la Rete Semantica “impara” un concetto tramite contributi ripe- 
tuti da diverse fonti indipendenti. [...] Il ragionamento che sta dietro 
questo approccio, quindi, è che non esiste un magazzino centrale del- 


31 <http://www.foaf-project.org/>. 
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l'informazione, e nessuna autorità su alcunché. Collegando le cose tra 
di loro potremo fare molta strada verso la creazione di una compren- 
sione comune. La Rete Semantica funzionerà quando ci saremo messi 
d'accordo sui termini, ma anche se non ci saremo riusciti.? 


La pretesa della rete semantica non é dunque quella di poter rappre- 
sentare tutti i dati o il sapere in qualche ristretto insieme di formalismi, 
ma piuttosto fare si che la possibilità di linkare i dati a nuovi dati permet- 
ta di usarli in modo sempre piü ampio, confidando nell'intelligenza di- 
stribuita e interconnessa dei navigatori. L'ambizione del W3C consiste 
nell'incrementare i dati a disposizione, e nel valorizzarli tramite nuove 
tecnologie che si aggiungono ai pilastri del Web. L'estensione del livello 
di inferenza che può essere ottenuta automaticamente non è dunque uno 
scopo ma semmai una conseguenza auspicabile”. 

Questa evoluzione facilita la creazione di gruppi con interessi comu- 
ni, vere e proprie comunità aperte in rete. Nonostante le applicazioni del 
Web Semantico siano per il momento confinate per lo più all'ambito ac- 
cademico, le loro possibili implicazioni cominciano a diventare evidenti. 
Restando nei confini della ricerca accademica, non è difficile vedere le 
implicazioni di tale rivoluzione non solo nella scienza del Web, ma anche 
nella pratica della ricerca in generale. Grazie alla costruzione di un Web 
ipertestuale, un gruppo di qualsiasi dimensione può comunicare con fa- 
cilità, acquisire sapere e veicolarlo velocemente, superare le incompren- 
sioni e ridurre la ridondanza degli sforzi. «L'universalità, scrive ancora 
Tim Berners-Lee, deve esistere in molte dimensioni. Tanto per comincia- 
re, dobbiamo essere in grado di collegare tra loro molti documenti, dalle 
bozze alle successive versioni fino ai documenti definitivi»*. Un passag- 
gio essenziale a non perdere le tappe del processo di un ragionamento, 
perché quando facciamo ricerca il processo tramite cui si raggiunge un 
risultato è importante al pari del risultato stesso. 


Qualora nuove persone entrassero in un gruppo, avrebbero a disposi- 
zione tutto un passato di decisioni e motivazioni. Quando lasceranno 
il gruppo, il loro lavoro sarà già stato assorbito e integrato. E come in- 
teressante bonus, l'analisi automatica della rete di conoscenza potreb- 
be consentire ai partecipanti di trarre conclusioni sulla gestione e l'or- 
ganizzazione della loro attività collettiva, un'impresa che non sarebbe 
stata possibile altrimenti”. 


32 T. Berners-Lee, W. Hall, J.A. Hendler, K. O'Hara, N. Shadbolt, D.J. Weitzner, A 
Framework for Web Science, cit., p. 163. 

33 Ivi, p. 30. 

34 Ivi, p. 128. 

35 Ivi, p. 143. 


80 LA SCIENZA E LA RETE 


Uno scenario che non è molto distante da quello prefigurato, nel 
1945, da Vannevar Bush. 


3. Ragnatele sociali: dal Web 2.0 al Web 3.0 


Di pari passo con la definizione e lo sviluppo del Web semantico, si è 
assistito a un'evoluzione sociale del Web che, ad un primo sguardo, sem- 
bra divergere dalla prospettiva abbracciata da Berners-Lee e dagli archi- 
tetti del Web che fanno capo al W3C. Dal 2004 si è infatti cominciato a 
parlare di “Web 2.05 termine coniato dall'editore americano Tim O'Reil- 
ly per definire «un insieme di tendenze economiche, sociali e tecnologi- 
che che formano collettivamente la base per la futura generazione di In- 
ternet, che diventa un mezzo più maturo» e definito sulla base di alcune 
particolari caratteristiche: partecipazione degli utenti, apertura ed effetti 
di rete. Questa nuova definizione è stata apertamente criticata dallo 
stesso Berners-Lee, che ha affermato che l'attuale evoluzione del Web 
non è altro che «l'uso di standard creati dalle stesse persone che lavorano 
sul cosiddetto Web1.0» (in primo luogo URL/URI, (X)HTML, HTTP), 
uno spazio di documentazione progettato dal principio come «spazio 
collaborativo, in cui le persone potessero interagire»?. 

È certamente vero che l’aspetto tecnologico del Web 2.0 è funzionale 
alle caratteristiche delle reti sociali e della cooperazione tra utenti, e le 
nuove tecnologie che vengono sviluppate poggiano sui princìpi architet- 
tonici di Internet, Web e web semantico, vale a dire l'apertura e l'univer- 
salità che si esplicano nell'architettura a strati, nella decentralizzazione, 
nella “open world assumption’, nella centralità degli URI e nel principio 
del “data linking”. 

Tuttavia, il termine Web 2.0 si è diffuso divenendo l'espressione con 
cui si sintetizzano i più recenti fenomeni tecnico-sociali che trovano spa- 
zio sul WWW. Si tratta di siti come MySpace e Facebook, reti sociali tra 
persone che condividono gli stessi interessi (il numero di utenti di Face- 
book ha raggiunto, nell'aprile 2009, i duecento milioni), il cui successo è 
dato dalla facilità con cui è possibile trovare e collegarsi ad altri utenti già 
presenti nel “mondo piccolo” del network; ma anche come YouTube, 
eBay, e le migliaia di siti dalle caratteristiche analoghe, basati su un mo- 
dello di Web inteso come canale essenziale per reperire, creare, gestire e 


36 Cfr. T. O'Reilly, Che cos'è web 2.0, 2004, <http://www.awaredesign.eu/articles/ 
14-Cos-Web-2-0>. Si veda anche il video, molto istruttivo, Web 2.0 ... The Machine is 
Us/ing Us di Michael Wesch, docente di antropologia culturale alla Kansas State Uni- 
versity, online su Youtube all'URL <http://www.youtube.com/watch?v=6gmP4n- 
KOEOE>. 

37 Cfr. l'intervista di Scott Laningham a Tim Berners-Lee del 22 agosto 2006 al- 
l'URL: <http://www.ibm.com/developerworks/podcast/dwi/cm-int082206txt.html>. 
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condividere informazioni, tramite aggregatori dell'accesso a servizi che, 
fino a pochi anni fa, erano disponibili solo off-line. 

Un principio fondamentale di questa evoluzione è il cosiddetto 
“mash up" (letteralmente: “poltiglia”)?, che si traduce in applicazioni on- 
line che combinano o miscelano «dati e servizi provenienti da due o più 
fonti per creare qualcosa di nuovo»*. Un esempio del principio è la tra- 
smissione di RAI3 Blob, che rimescola spezzoni di programmi televisivi e 
di film accompagnati da nuovi titoli e intestazioni che attraverso la som- 
ma dei frammenti, restituiscono un nuovo significato. Un altro esempio 
di mash up, questa volta sul Web, é quello della combinazione di Google 
Maps con altri servizi, come flickr, un sito che consente agli utenti di 
pubblicare e condividere fotografie sul Web; nello specifico, la combina- 
zione di Google Maps e flickr permette di localizzare e visualizzare le im- 
magini di flickr su una mappa”. 

Da un punto di vista dello sviluppo delle tecnologie, gli utenti sono 
coinvolti nel processo di programmazione e trattati come co-sviluppato- 
ri, il software viene rilasciato spesso e la sua pubblicazione non é subor- 
dinata all'accumularsi di miglioramenti e innovazioni sostanziali, e il 
modello di progettazione che viene seguito é indipendente dall'hardware 
(ora sempre più aperto anche ai cellulari) e a strati. 


38 In termini informatici, indica un'applicazione che usa contenuto da piü sor- 
genti per creare un servizio completamente nuovo. Cfr. <http://it.wikipedia.org/wiki/ 
Mash-up (informatica)? (10/09). 

39 J. Musser, Web Service e mashup, in V. Di Bari (a cura di), Web 2.0, Il Sole 24 
ore, Milano 2007, p. 115. 

40 Cfr. <http://www.earthalbum.com/>; <http://loc.alize.us/>. La tecnologia che 
dà facoltà di farlo sono le API (Application Programming Interface, <http://it.wikipe- 
dia.org/wiki/Application programming interface») insiemi di procedure, strutture 
dati, classi di oggetti e protocolli forniti dalle librerie e dai servizi del sistema operati- 
vo per supportare l'implementazione di applicazioni, che, quando liberamente dispo- 
nibili, si dicono aperte (Open API). «Nel mondo del software l'attenzione intorno ai 
mash up viene sostenuta dalle possibilità di uno sviluppo più rapido e agile, basato su 
dati e servizi riutilizzabili su larga scala. Lo stesso HousingMaps.com, che è stato 
creato da un solo programmatore nell'arco di pochi giorni, é la dimostrazione di que- 
ste possibilità. La realizzazione di un'applicazione tanto sofisticata in cosi poco tem- 
po sarebbe stata impensabile solo pochi anni fa. Tuttavia, con i preziosi sistemi per la 
generazione di contenuti e gli strumenti ricchi e potenti che si trovano su Google 
Maps, tutto è stato reso più semplice. 

ChicagoCrime.org é un altro importante mash up basato sulle mappe. Riutilizza 
una serie di dati sulla criminalità di per sé di difficile lettura e li rende molto più 
comprensibili grazie a una migliore disposizione, presentazione e mappatura. Nel 
mercato del commercio elettronico, quasi la metà di tutti i beni in lista su eBay ven- 
gono presentati tramite strumenti basati sulle API dei servizi Web di eBay. Oggi 
Amazon dispone di oltre 250.000 programmatori registrati che creano migliaia di ap- 
plicazioni. Nel terzo quadrimestre del 2006 più del 50% di tutte le transazioni su Sale- 
sforce.com sono state caricate grazie ad applicazioni esterne utilizzando API specifi- 
che e non tramite Web standard della stessa Salesforce.com». J. Musser, Web Service e 
mash up, cit., p. 116. 
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Il Web fa sempre più da specchio alla società umana di cui riflette gli 
interessi, che si estendono su un arco molto ampio di assunti, valori e 
culture. La rete è usata per condividere informazioni, per divertirsi, per 
vendere e comprare, e per fare scienza in modi radicalmente nuovi. Il 
Web 2.0 è stato così rappresentato «come un insieme di principi e di pro- 
cedure che collegano un autentico sistema solare di siti che fanno propri 
tali principi, in tutto o in parte, a una distanza variabile da tale centro»*!. 

Ma quali sono i principi che caratterizzano la fisionomia del Web 2.0? 
I tentativi di sintesi del fenomeno sono molti e variano tra loro. Tuttavia, 
è possibile rintracciare sei concetti, o architravi portanti della sua strut- 
tura tecnica e sociale: 


1) "Il web come piattaforma" 

I servizi web sostituiscono sempre più le applicazioni desktop. Un 
esempio è l'account di Google, che offre gratuitamente agli utenti con- 
nessi l'integrazione di servizi prima disponibili solo in locale, come ad 
esempio l'email (gmail), editor di scrittura tipo Word e suite di applica- 
zioni come Microsoft Office (Google docs), il calendario (Google calen- 
dar) e moltissimi altri”. Google diviene così l'intermediario tra utenti e 
informazione, creando veri e propri desktop online in cui le applicazioni 
non sono concepite come pacchetti in vendita ma fornite come servizio, 
senza licenze o condizioni di vendita, e senza richiedere la portabilità su 
piattaforme diverse affinché i clienti possano utilizzare il software sulle 
proprie macchine. Un corollario di questa trasformazione è che il soft- 
ware è concepito sempre più come un servizio e non come un prodotto. 
Il modello Google si contrappone così al modello tradizionale à la Mi- 
crosoft: 


da una parte, un singolo fornitore di software, la cui massiccia base e 
il sistema operativo strettamente integrato con le API permettono di 
controllare il paradigma di programmazione; dall'altra, un sistema 
senza un proprietario, tenuto insieme da una serie di protocolli, stan- 
dard aperti e accordi di cooperazione". 


Con il Web 2.0 si supera il concetto di sito Web come entità autono- 
ma incapace di comunicare con il mondo esterno; si diffondono molte 
applicazioni sviluppate dal basso da comunità decentralizzate, che rien- 
trano nel cosiddetto social software; inoltre, i dati online diventano indi- 


41 T. O'Reilly, Che cos'è web 2.0, cit. 

42 Per usufruirne, è sufficiente avere un account google, e accedere a tali servizi 
dalla pagina<http://www.google.it/intl/it/options/> (in italiano). 

43 In termini tecnici, sono servizi “platform independent” vale a dire indipenden- 
ti dal sistema operativo dell'utente. 

44 T. O'Reilly, Che cos'è web 2.0, cit. 
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pendenti dalle applicazioni e possono essere utilizzati da servizi diversi. 
Gli esempi di siti di questo tipo sono molteplici: si vedano, tra gli altri, 
Librarything e Anobii, nati per creare cataloghi di libri, oltre a schede di 
lettura e commenti, e per socializzare, condividere e scambiarsi biblio- 
grafie e Citeulike e Connotea‘, che hanno lo stesso scopo dei due siti 
precedenti ma sono finalizzati alla creazione di bibliografie scientifiche. 
Gli ultimi due in particolare mirano a sostituire programmi come End- 
Note”, un software proprietario e a pagamento che dev'essere installato 
sul computer di chi lo usa. 


2) Centralità dei dati 

«Senza i dati, scrive ancora O'Reilly parafrasando una nota afferma- 
zione di Kant, gli strumenti sono inutili; senza il software, i dati sono in- 
gestibili». Google si configura così come un insieme di strumenti soft- 
ware e un ampio database specializzato‘. La disponibilità di un'enorme 
quantità di dati è una caratteristica fondamentale del nuovo web. Le figu- 
re 8 e 9 nella pagina seguente mostrano sorgenti dati semantiche sul 
Web, rispettivamente nel 2007 e nel 2009. 


3) Contenuti prodotti dagli utenti (User generated content) 

Un importante corollario del principio precedente è che i contenuti 
sono generati dagli utenti e condivisi all’interno di comunità. In questo 
modo, sono gli stessi utenti a creare il "servizio" ^. E questo un elemento 
che caratterizza il Web 2.0 e il social software: 


Da “The computer moves in" a “Yes, you. You control the informa- 
tion age. Welcome to your world". Dallormai celebre copertina del 
Time del 3 gennaio 1983*, che nominava il personal computer 
come "machine of the year", a quella, quasi un quarto di secolo 
dopo, del 25 dicembre 2006*, in cui il titolo di “man of the year” 
va alla seconda persona, sia singolare sia plurale, della lingua in- 
glese, scritta, o meglio, digitata al centro di un monitor. 

“La persona dell'anno” recita il Time, “sei tu” “Benvenuto nel tuo 

mondo”. 


45 < http://www.librarything.it/>; <http://www.anobii.com/>. 

46 <http://www.citeulike.org>; <http://www.connotea.com>. 

47 <http://www.endnote.com/>. 

48 T. O'Reilly, Che cos'è web 2.0, cit. 

49 Il Web è ricco di esempi. Tra essi, oltre al già citato Flickr <http://www-flickr. - 
com» vale la pena menzionare Youtube e ebay, che non hanno bisogno di spiegazio - 
ni. 

50 <http://www.time.com/time/covers/0,16641,19830103,00.html>. 

51 <http://www.time.com/time/covers/0,16641,20061225,00.html>. 
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Figura 9. L'immagine sopra, aggiornata al marzo 2009” 


52 Da <http://linkeddata.org/>. 
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Se nel gennaio del 1983 la figura umana veniva presentata stilizza- 
ta e glaciale di fronte al computer, sul cui schermo comparivano 
numeri e grafici, in un ambiente cupo dove, per contrasto, solo la 
sedia ed il tavolo erano caratterizzati da un aspetto tradizionale e 
da colori caldi, nella copertina del 2006 questa presenza è total- 
mente astratta, ridotta allessenza di un pronome personale, al po- 
sto dei grafici nel monitor, ora a cristalli liquidi. 


La rete di calcolatori lascia così spazio alle reti sociali sul web, in cui 
gli utenti producono e condividono contenuti, arricchendoli di ulteriori 
dati e collegandoli tra loro. Nasce un nuovo modo di concepire la comu- 
nicazione: chiunque abbia accesso a Internet crea contenuti e li condivi- 
de con altri; chiunque può replicare a contenuti proposti, classificarli in 
modi nuovi e votarli, dando vita a un'agorà virtuale in cui l'interattività è 
un elemento fondante. 

I blog sono, in questo contesto, un importante strumento di pubblica- 
zione interamente nelle mani degli utenti. 


La “blogosfera” può essere considerata un nuovo equivalente peer-to- 
peer di Usenet e dei bulletin-board, le aree conversazionali del primo 
internet. Non solo è possibile iscriversi ai siti degli altri e collegarsi 
facilmente ai singoli commenti su una pagina: tramite un meccani- 
smo noto come trackback si può anche vedere quando qualcun altro 
si collega alle proprie pagine e rispondere, con link reciproci o ag- 
giungendo commenti”. 


I “trackback”, link monodirezionali che creano l'effetto di collegamenti 
a due vie, incrementano il grado di connessione dei contenuti e creano 
zone in cui il Web si presenta come una rete indiretta e più facile da navi- 
gare. Gli effetti sull'editoria online di questa funzione sono per certi versi 
rivoluzionari: 


L'avvento degli user generated content sta impattando soprattutto sul- 
la riorganizzazione dello scenario dell'informazione e dell'intratteni- 
mento (il settore media & entertainement). Chi produceva (e traeva 
profitto) dalla realizzazione di contenuti (i cosiddetti content provi- 
der) ha dovuto (o dovrà, velocemente) riposizionarsi perché nuovi 
player sono subentrati e hanno assunto in breve tempo posizioni rile- 
vanti. Alcuni content provider tradizionali hanno già integrato alla 


53 Un approccio visuale simile sarà utilizzato l'anno successivo nel famoso spot 
pubblicitario “1984” di Ridley Scott per l'Apple Macintosh. Il video dello spot è di- 
sponibile online a diversi indirizzi, per maggiori informazioni vedi <http://en.wiki- 
pedia.org/wiki/1984_%28television_commercial%29>. 

54 E. Meschini, eContent: tradizionale, semantico o 2.0?, 2006, <http://dspace.uni- 
tus.it/handle/2067/162>. 

55 T. O'Reilly, Che cos'è web 2.0, cit. 
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creazione di contenuti tradizionali la creazione di ambienti e stru- 
menti che permettano l'accesso a contenuti pubblicati da non profes- 
sionisti, come per esempio la BBC con i suoi innovativi progetti inte- 
rattivi9. 


Il sito che meglio esemplifica questo principio è YouTube”, progetto 
creato nel 2005 e acquistato nel 2006 da Google, che consente di condivi- 
dere video creati dagli utenti e raccoglie centinaia di migliaia di filmati in 
tutte le lingue. 

Un elemento che ha arricchito questa tipologia di siti web sono le 
"folksonomie5 neologismo creato nel 2003 da Thomas Vander Wal che 
deriva dalla contrazione dei termini “folks” e “taxonomy”, per indicare sti- 
li di categorizzazione collaborativa che utilizzano parole chiave libera- 
mente scelte, generalmente definite tag. «In maniera più semplice e con- 
creta, questo termine si riferisce alla metodologia utilizzata da gruppi di 
persone che collaborano spontaneamente per organizzare in categorie le 
informazioni disponibili attraverso Internet»*. Se l'uso di ontologie ag- 
giunge una struttura ai dati, con le folksonomie la struttura emerge in 
modo organico dall'organizzazione delle richieste informative dei singoli 
individui. Le folksonomie sorgono quando un ampio numero di persone 
è interessato a qualche informazione e incoraggiato a descriverla - in 
gergo, a “taggarla” Si tratta dunque di sistemi di classificazione distribui- 
ti, ed è questo elemento a costituirne la caratteristica principale®. 

All'aumentare dei tag inseriti dagli utenti, questi tendono a essere riu- 
sati e applicati a nuovi elementi da altri utenti. 


Il valore aggiunto delle folksonomie sta proprio nell'aggregazione e 
nella condivisione, cioé nella natura sociale del fenomeno: la loro for- 
za non é la precisione ma l'ampia adesione popolare: la gente, appun- 
to. Anziché sforzarsi di creare sistemi di classificazione che incontri- 
no i modelli mentali degli utenti, si fa in modo che siano gli utenti 
stessi - dal basso - a far emergere spontaneamente (attraverso un 
processo collaborativo e una sorta di selezione naturale) modelli 
mentali comuni, condivisi. Sarebbe infatti più giusto definire le folk- 
sonomie come sistemi di classificazione distribuita. 


Certamente, la libertà nell'assegnare parole chiave a un contenuto 
può creare un eccesso di informazione e una certa confusione. Tuttavia, i 


56 V. Di Bari, Introduzione al Web2.0, in Id. (a cura di), Web 2.0, cit., p. 18. 

57 <http://www.youtube.com>. 

58 <http://it.wikipedia.org/wiki/Folksonomia> (10/09). 

59 Cfr. E. Quintarelli, Folksonomies: power to the people, «ISKO Italy-UniMIB 
meeting», 2005, <http://www.iskoi.org/doc/folksonomies.htm>. 

60 L. Rosati, La ricerca si fa sociale: il tagging e la folksonomia, in V. Di Bari (a cura 
di), Web 2.0, cit., p. 66. 
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tag sono generati dalle interazioni che avvengono nel mondo reale e rive- 
lano connessioni reali tra contenuti e utenti. Tali strutture permettono 
alla semantica di emergere da accordi impliciti (ex post), diversamente da 
quanto avviene nella costruzione di ontologie, le quali indicano accordi 
espliciti (ex ante); il campo delle dinamiche semiotiche ha come premes- 
sa l'idea che gli accordi comunicativi o i sistemi di organizzazione dell'in- 
formazione spesso si sviluppino attraverso processi decentralizzati di in- 
venzione e negoziazione?*!. 

La distinzione tra ontologie e folksonomie ha un notevole rilievo su 
un piano filosofico, e merita qualche parola in piü. E stato osservato che 
le folksonomie sono preferibili all'utilizzo di ontologie controllate e cen- 
tralizzate. Se infatti la possibilità di annotare pagine web usando vocabo- 
lari controllati puó accrescere le possibilità di trovare ció che cerchiamo 
con esattezza, d'altra parte una base ampia ed eterogenea di utenti non 
consente che siano molte le persone che scelgono di adottare o di mante- 
nere un'ontologia complessa. Creare ontologie richiede un investimento 
di tempo e di energie molto elevato. Tuttavia è altrettanto vero che le pa- 
role chiave scelte da una persona in modo indipendente e scoordinato 
dagli altri possono essere inutili o inaccurate, e anche se l'uso di folkso- 
nomie è assai diffuso, queste rimangono uno strumento di classificazione 
impreciso. Allo stesso tempo, però, la diffusione di strumenti per l'uso di 
ontologie è assai più lenta di quanto non stia avvenendo per le applica- 
zioni sociali che si servono delle folksonomie. Dunque, è inopportuno e 
improprio considerare folksonomie e ontologie come strategie mutua- 
mente escludentisi - molto meglio invece adottarle come complementari. 
Le prime si rivelano cosi di grande utilità per la ricerca di documenti da 
parte degli utenti; le seconde sono essenziali per il recupero automatizza- 
to di dati, in modo particolare in campo scientifico*. 


Spesso la folksonomia viene vista come un'ontologia debole, dotata di 
una struttura leggera ma di valore (approssimativamente circoscritta 
all'oggetto che viene etichettato, ai tag e all'identità della persona che 
effettua l'operazione di etichettatura). Credo fermamente - scrive 
Vander Wal - in una folksonomia i cui risultati saranno migliorati 
grazie all'abbinamento con la tassonomia. Le aree dove la tassonomia 
é debole (dove non riesce a far emergere i risultati con facilità, non é 
esaustiva, non é facile da applicare e richiede tante risorse per essere 
creata e gestita) sono le aree in cui la folksonomia é veramente forte. 
Al contrario, le aree dove la folksonomia è più debole (disordine, 
scarsa rintracciabilità e lentezza a far emergere i dati) sono ambiti nei 
quali la tassonomia può esserci d'aiuto fornendoci un qualche soste- 


61 T. Berners-Lee, W. Hall, J.A. Hendler, K. O'Hara, N. Shadbolt and D.J. Weitzn- 
er, A Framework for Web Science, cit. p. 32. 
62 Ivi. 
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gno. Oggi non sono disponibili strumenti che consentono questo 
mix, ma sono sempre più richiesti dalle imprese®. 


In realtà, gli esempi di convergenza tra l'impostazione del web se- 
mantico e quella del Web 2.0 non mancano. Tra gli altri, vale la pena ri- 
cordare Visual Thesaurus“, un dizionario della lingua inglese, che utiliz- 
za il software di visualizzazione ThinkMap® e che è basato su WordNet®, 
un database lessicale della lingua inglese il cui progetto è stato avviato 
nel 1985, in cui i termini sono organizzati tra di loro sulla base di rap- 
porti semantici che caratterizzano le classificazioni ontologiche (iponi- 
mia, ipernimia, olonomia e meronimia). Il vocabolario presenta i vari si- 
gnificati di un termine in forma di grafo i cui rami sono tipizzati in base 
al tipo di relazione. 


Inserendo "Information" ad esempio, si può navigare il grafo fino ad 
arrivare ai termini “Data” e “Knowledge” da un lato, e “Entropy” dal- 
l’altro. E ancora, “Love” presenta numerosi nodi, che coprono tutti i 
vari significati del termine, dai significati più astratti all'attrazione fi- 
sica, e presenta anche, con un rapporto di antinomia, la parola “Dea- 
th. 


L'uso di WordNet con ThinkMap dimostra come sia possibile creare 
servizi avanzati sulla base di contenuti organizzati semanticamente. 


4) Intelligenza collettiva 

È uno dei tratti essenziali della metodologia e della pratica di ricerca 
che caratterizza lo sviluppo delle reti telematiche sin dal principio, un fe- 
nomeno che Pierre Lévy definisce come “intelligenza collettiva”, intelli- 
genza distribuita e connessa in rete che valorizza le competenze indivi- 
duali attraverso uno spirito collaborativo®. 

Un esempio illustre di intelligenza collettiva è Wikipedia, unenciclo- 
pedia online basata sull'idea che ciascuna voce possa essere aggiunta e 
modificata da chiunque e che applica alla creazione di contenuti il detto 
di Eric Raymond (coniato originariamente nel contesto del software 
open source), secondo cui «con molti occhi puntati addosso, ogni bug di- 
venta una bazzecola»®. L'impostazione di Wikipedia si sta diffondendo 


63 T. Vander Wal, La folksonomia e il Web semantico, in V. Di Bari (a cura di), 
Web 2.0, cit., pp. 78-79. 

64 <http://www.visualthesaurus.com/>. 

65 <http://www.thinkmap.com/>. 

66 <http://wordnet.princeton.edu/>. 

67 E Meschini, eContent: tradizionale, semantico o 2.0?, cit. 

68 P. Lévy, Intelligenza collettiva. Per un'antropologia del cyberspazio, Feltrinelli, 
Milano 1999. 

69 Ivi. 
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anche in ambito scientifico e letterario, dove il tradizionale sistema delle 
recensioni su carta è affiancato da veri e propri servizi online come quel- 
lo di Internet Bookshop, Amazon.com (oltre al già citato Anobii, che in- 
dicizza oltre undici milioni di libri e, in aggiunta alla possibilità di pub- 
blicare recensioni consente agli utenti di inserire moltissime informazio- 
ni come la data di inizio e di fine lettura, commenti come nelle note a 
margine, un voto che va da uno a quattro)”. 


5) Decentralizzazione: ogni client é anche un server (P2P) 

Molti sistemi del web2.0 sono pensati e progettati per incoraggiare la 
partecipazione diretta degli utenti in almeno tre modi, indicati da Dan 
Bricklin come segue: 


Il primo, dimostrato da Yahoo!, é di pagare le persone perché lo fac- 
ciano. Il secondo, che prende ispirazione dalla comunità open source, 
é di cercare volontari che realizzino lo stesso compito. L'Open Direc- 
tory Project, un concorrente open source di Yahoo, ne é il risultato. 
Ma Napster ha dimostrato un terzo modo. Avendo come default la 
possibilità di mettere a disposizione automaticamente qualsiasi pezzo 
musicale che viene scaricato, Napster ha consentito a ogni utente di 
contribuire all'aumento del valore del database condiviso. Questo 
stesso approccio é stato seguito da tutti gli altri servizi di condivisione 
di file P2P.”! 


I protocolli peer to peer trasformano i client (componenti che accedo- 
no ai servizi o alle risorse) in server (componenti che forniscono servizi). 
In pratica, sezioni particolari della memoria dei calcolatori degli utenti 
divengono accessibili agli altri utenti. 


6) Accesso aperto 

In tale contesto, le licenze software e il controllo delle API divengono 
irrilevanti in quanto il software non ha più bisogno di essere distribuito 
ma solo utilizzato, e il suo valore é proporzionale alla scala e al dinami- 
smo dei dati che esso aiuta a gestire. Il principio dell'accesso aperto per- 
mea cosi tutti gli strati della rete, dai protocolli ai contenuti, ed è un prin- 
cipio che informa la rete ad ogni livello, definendo tanto gli aspetti tecni- 
ci quanto la filosofia e gli aspetti socio-culturali del cosiddetto software 
sociale. 

Si osservi infine che dal 2006 é stata introdotta da Jeffrey Zeldman l'e- 
spressione Web 3.07. I significati attribuiti al termine a partire da quella 


70 Si veda L. Lipperini, La critica fai da te. Dai libri al web, ecco il popolo dei recen- 
sori, «a Repubblica», 2 giugno 2009. 

7! D. Bricklin, The Cornucopia of the Commons, cit. in T. O'Reilly, Che cos'é web 
2.0, cit. 


90 LA SCIENZA E LA RETE 


data sono stati vari e diversi, e lo stesso Berners-Lee si è espresso al ri- 
guardo con le parole che seguono: 


Le persone si chiedono che cosa sia il Web 3.0. Penso che, forse, 
quando si sarà ottenuta una sovrapposizione della Grafica Vettoriale 
Scalabile - oggi tutto appare poco nitido, con pieghe ed increspature - 
nel Web 2.0 e l'accesso ad un Web semantico integrato attraverso una 
gran quantità di dati, si potrà ottenere l'accesso ad un'incredibile ri- 
sorsa di dati che genereranno il Web 3.07. 


In termini piü generici, onnicomprensivi e generalmente condivisi, 
dalla rete dei computer del cosiddetto Web 1.0, passando attraverso le 
reti sociali che caratterizzano il Web 2.0, si sta ora giungendo a una rete 
globale di dati. Il Web 3.0 é la sintesi di questi tre aspetti e nel prossimo 
capitolo lo intenderemo in questa accezione. 


72 J. Zeldman, Web3.0, «A List Apart,» 210, 2006, <http://www.alistapart.com/ar- 
ticles/web3point0/>. 

73 Cfr. <http://www.nytimes.com/2006/05/23/technology/23iht-web.html?_r=1>. 
Trad. it. dalla voce Web3.0 di Wikipedia: <http://it.wikipedia.org/wiki/Web_3.0> 
(10/09). 


CAPITOLO 4 


FARE SCIENZA IN RETE 


La ricerca scientifica è stata completamente trasformata dalla dispo- 
nibilità della rete; in questo caso si intende ovviamente la grande tela 
intessuta da Internet e dal web attorno al mondo. Il ricercatore scien- 
tifico che pone mano a un nuovo progetto non compie quasi più alcu- 
no degli atti che sino a poco tempo addietro costituivano la norma di 
questo genere di attività: recarsi in biblioteca, consultare libri, scorre- 
re riviste, aprire decine di classificatori repleti di schede compilate a 
mano. Nella maggior parte dei casi il ricercatore non entra nemmeno 
negli archivi del proprio computer. Va direttamente in rete, nella qua- 
le sa di trovare in abbondanza i documenti, gli articoli, i dati, i risul- 
tati di altri esperimenti, le notizie circa le attività di altri laboratori 
che lo interessano. Dopo qualche tempo passato a scandagliare accu- 
ratamente la rete, il ricercatore si metterà in contatto con altri colle- 
ghi sparsi nel mondo, al fine di ottenere da essi suggerimenti e com- 
menti — nei limiti, ovviamente, consentiti dalla competizione interna- 
zionale tra i ricercatori. Allorché avrà prodotto qualche primo risulta- 
to, lo trasmetterà attraverso la rete a qualche collega di cui si fida; e 
quando considererà sufficientemente maturi i risultati della ricerca li 
diffonderà in qualche minuto, attraverso la rete, a tutte le riviste spe- 
cializzate, i media, i laboratori alleati e concorrenti. 

L. Gallino, Tecnologia e democrazia. 


1. Un ritorno all'antico: dalle RFC al software libero 


«Un elemento chiave della crescita di Internet é stato l'accesso libero e 
aperto alla documentazione di base, e in special modo alle specifiche dei 
protocolli». Ad affermarlo sono i suoi stessi inventori nella già citata A 
Brief History of the Internet, in cui un paragrafo è dedicato in particolare 
al ruolo della documentazione nello sviluppo e nella diffusione della 
rete!. I giovani laureati che collaborano alla creazione di ARPANET e dei 
protocolli TCP/IP sono mossi dai medesimi principi che animano il di- 
battito sulla repubblica delle lettere sin dal suo nascere, un dibattito di 
cui adottano metodi e ideali: se infatti il concetto di humanitas per gli 
umanisti é strettamente legato alla comunicazione, intesa come un atto 
di generosità verso gli altri che non si realizza in mera erudizione, comu- 
nicazione e comunicare sono termini che vengono usati per indicare il 


1 B.M. Leiner, V.G. Cerf V.G., D.D. Clark, R.E. Kahn, L. Kleinrock, D.C. Lynch, J. 
Postel, L.G. Roberts, S. Wolff, A Brief History of the Internet, cit., p. 35. 
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dovere di trasmettere il sapere ai posteri; dunque un atto non di mera li- 
beralità, ma di giustizia. Trasmettere le proprie conoscenze costituisce il 
punto di arrivo e l'anima stessa del lavoro intellettuale: una condizione 
indispensabile allo svolgimento dell'attività di ricerca. Oltre all'amore per 
la ricerca sono la volontà e la capacità di comunicare il sapere a definire 
il dotto degno di questo nome. Il dibattito scientifico pubblico si configu- 
ra come una rete in progressiva espansione che, attraverso continue cita- 
zioni reciproche (che si esprimono in recensioni, note, riassunti, biblio- 
grafie e indici, discussioni, lettere aperte) costruisce un discorso comune. 

Gli scienziati americani prendono tuttavia le distanze dagli strumenti 
consueti della comunicazione scientifica, ritenendo il ciclo tradizionale 
della pubblicazione accademica troppo formalizzato e lento per lo scam- 
bio di idee essenziali a creare reti, e si dotano di nuovi mezzi di comuni- 
cazione e pubblicazione formalizzando così nuove procedure per la co- 
struzione di consenso, in primis le Request for Comments (RFC), docu- 
menti ufficiali approvati dall'IETF (Internet Engineering Task Force) che 
propongono, aggiornano o dichiarano superati gli standard di Internet". 

L'invenzione della posta elettronica nel 1972 è uno strumento di co- 
municazione essenziale. L'e-mail si configura da principio come una kil- 
ler application, un'applicazione decisiva per la diffusione di Internet ed è, 
ancora oggi, il servizio più usato della rete. La nascita della posta elettro- 
nica è molto importante anche per l'affermazione del concetto di author- 
ship, letteralmente “paternità intellettuale”, concetto che in un primo mo- 
mento resta indeterminato a vantaggio di una scrittura collettiva e in cui 
l'autore assume un'importanza marginale e secondaria. La diffusione di 
mailing list integra lo strumento delle RFC sistematizzando le procedure 
decisionali all'interno dei gruppi di lavoro’. 

Internet, pensata come strumento per condividere l'informazione e le 
risorse di calcolo, ha rivoluzionato l'attività della ricerca stessa, trasfor- 
mando i principi della collaborazione tra scienziati e della libera circola- 
zione del sapere scientifico in una pratica di lavoro, e arricchendola nel 
tempo di sempre nuovi strumenti. 

I suoi principi sono stati formalizzati e rafforzati grazie alla sinergia 
col movimento per il software libero (free software) nelle sue diverse va- 
rianti*. La storia del software libero, che ha il suo epicentro negli Stati 


2 L'archivio delle RFC, curato da Jon Postel, è online all'URL 
<http://www.ietf.org/rfc.html>. Il progetto di traduzione italiana delle RFC è accessi- 
bile al seguente indirizzo <http://rfc.altervista.org/>. 

3 Si osservi ad esempio che la Internet Engeneering Task Force ha 75 gruppi di la- 
voro, ciascuno dei quali lavora su un aspetto particolare della progettazione e imple- 
mentazione di Internet. I gruppi fanno uso di mailing list per discutere e poi, una 
volta che sia stato raggiunto consenso su un documento, questo viene distribuito 
come REC. 

4 Un'espressione alternativa a Free software è Open source software, con la quale si 
intende software il cui codice sorgente è aperto, ma rilasciato con licenze meno re- 
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Uniti, e in particolare nei laboratori del MIT e in California (che sono 
state la culla, come abbiamo visto, anche di Internet) ci indica un model- 
lo fortunato di sviluppo delle tecnologie informatiche. 

È Richard Stallman, sistemista al laboratorio di intelligenza artificiale 
del MIT dal 1971 al 1983, a dare voce al movimento e a farsi portatore 
della filosofia del software libero? a partire dai primi anni 80. 


La sua convinzione sulla non utilità e, anzi, sulla dannosità di non 
diffondere il codice di controllo della macchina, basata su premesse 
insieme etiche e funzionali, trovava una continua conferma nei molti 
problemi quotidiani connessi all'utilizzo di computer e altra strumen- 
tazione elettronica®. 


Così, trovandosi alle prese con una stampante donata dalla Xerox al 
prestigioso laboratorio di Boston, Stallmann si scontra con l'impossibilità 
di modificare il codice sorgente del dispositivo a causa dell'imposizione 
del copyright sul software da parte della casa di produzione. Un evento 
scatenante che porterà il fisico a lasciare il MIT, prefiggendosi l'obbietti- 
vo di difendere la libertà del software e di creare, a tal fine, un sistema 
operativo aperto e compatibile con Unix, intenzione che comunica al 
mondo nel 1983 attraverso l'antenata di Internet, ARPANET”. 

Ma che cos'è il software libero? Stallmann ha cura di precisare che 
l'aggettivo free è da intendersi nell'accezione di free speech e non di free 


strittive dalla licenza GNU/General Public License (GPL), promossa dalla Free Soft- 
ware Foundation. Più precisamente, mentre con free software si intende una filosofia 
politica di sviluppo e disseminazione della conoscenza, di cui il software è un caso 
particolare, l'espressione open source corrisponde all'applicazione commerciale dei 
programmi ispirati a quei principi. Perciò, è comprensibile la diffidenza che i sosteni- 
tori del software libero nutrono nei confronti del movimento open source. Si veda la 
seguente definizione di Open Source Software: <http://it.wikipedia.org/wiki/Open_ 
source> (10/09). Cfr. anche C. Di Bona, S. Ockman, M. Stone (a cura di), Open sour- 
ces. Voci della rivoluzione Open Source, Apogeo, Milano 1999 (ed. orig. 1999). 

5 Si veda <http://www.gnu.org/philosophy/philosophy.html>. 

6 M. Berra, A.R. Meo, Informatica solidale, cit., p. 83. Per una ricostruzione della 
storia del movimento GNU - free software, si vedano in particolare le pp. 82-97. Nel 
1985 Stallman fonda la Free Software Foundation, un'organizzazione nata allo scopo 
di convogliare le forze (lavoro e denaro) per lo sviluppo e la diffusione di programmi 
aperti. 

7 Il sistema operativo è «un insieme di programmi che consentono la gestione ra- 
zionale delle risorse del calcolatore, dalle unità di ingresso-uscita (tastiera, video, 
stampante) alla memoria centrale (quella che oggi viene chiamata RAM) e periferica 
(tipicamente, l'hard disk). Il sistema operativo è la parte centrale del software di base, 
ossia di quell'insieme di quei moduli software che sono generalmente venduti insie- 
me all'hardware [...]» M. Berra, A.R. Meo, Informatica solidale, Bollati Boringhieri 
Torino 2001, p. 84. Per una definizione tecnica, si veda la voce «http://it.wikipedia.o- 
rg/wiki/Sistema_operativo>. Unix è un sistema operativo sviluppato dalla AT&T, 
cfr.<http://it.wikipedia.org/wiki//Unix>. 
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beer: libero dunque non è sinonimo di gratuito*. La definizione di soft- 
ware libero si fonda sull'importante distinzione tra codice sorgente, il 
programma che viene scritto dai programmatori in linguaggi formalizza- 
ti simili al linguaggio naturale, e codice eseguibile, scritto in linguaggio 
macchina (fatto di zero e uno), molto difficile da scrivere e pressoché im- 
possibile da leggere anche per programmatori molto esperti’. Il codice 
sorgente viene convertito (in termini tecnici “compilato”) in codice ese- 
guibile tramite appositi programmi detti appunto compilatori. Un pas- 
saggio che consente ai programmi di funzionare, ma che comporta la 
perdita di informazioni essenziali al fine di comprenderli e modificarli. A 
sua volta, l'espressione "software libero" include la libertà di eseguire, co- 
piare, distribuire, studiare, cambiare e migliorare il software, azioni pos- 
sibili solo se, assieme al codice eseguibile di un programma, viene fornito 
anche il codice sorgente. Pertanto nella definizione di Stallman il soft- 
ware libero è tale se rispetta quattro libertà: 


1. Libertà di eseguire il programma, per qualsiasi scopo (libertà 0). 

2. Libertà di studiare come funziona il programma e adattarlo alle 
proprie necessità (libertà 1). L'accesso al codice sorgente ne è un pre- 
requisito. 

3. Libertà di ridistribuire copie in modo da aiutare il prossimo (liber- 
tà 2). 

4. Libertà di migliorare il programma e distribuirne pubblicamente i 
miglioramenti (e le versioni modificate in genere), in modo tale che 
tutta la comunità ne tragga beneficio (libertà 3). L'accesso al codice 
sorgente ne è un prerequisito”. 


Come si desume dalla definizione di cui sopra, nulla vieta che il soft- 
ware libero possa essere venduto. 

Nel 1985 Stallman fonda la Free Software Foundation (FSF), un'orga- 
nizzazione no profit basata sul lavoro di volontari”, per dare vita al pro- 
getto GNU, acronimo ricorsivo dell'espressione “GNU is Not Unix” con 
la quale il programmatore americano intende affermare che il suo siste- 
ma operativo sarà compatibile con Unix e tuttavia, a differenza di que- 


8 <http://www.gnu.org/philosophy/free-sw.html>. 

9 «I calcolatori della prima generazione dovevano essere programmati in linguag - 
gio macchina, ossia in questo complicato linguaggio fatto di lunghissime sequenze di 
simboli 1 e 0. [...] La programmazione in linguaggio macchina era operazione molto 
lunga e complessa, perché richiedeva la conoscenza minuta dell'architettura del cal- 
colatore, dei codici di tutte le istruzioni e il controllo mentale delle molte celle della 
memoria centrale. Per questo furono presto ideati linguaggi simbolici e sviluppati op- 
portuni programmi “traduttori” capaci di tradurre il codice simbolico scritto dal pro- 
grammatore in un programma in linguaggio macchina che facesse le stesse cose». M. 
Berra, A.R. Meo, Informatica solidale, cit., p. 74. 

10 <http://www.gnu.org/philosophy/free-sw.it.html>. 

11 <http://www.fsf.org/>. 
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st'ultimo, non sarà proprietario e sarà libero dalle restrizioni imposte dal 
copyright. Stallman sceglie inoltre di non rendere il codice sorgente che 
scrive di pubblico dominio, condizione giuridica in cui rientrano quei 
beni che non sono suscettibili di appropriazione da parte di alcun sog- 
getto, sia esso pubblico o privato", ma di creare un'apposita licenza a ga- 
ranzia delle quattro libertà enunciate nella definizione di cui sopra e co- 
nia a questo scopo il termine copyleft. Il termine, che letteralmente signi- 
fica “permesso di copia’, si basa su un gioco di parole che sfrutta la con- 
trapposizione right/left, destra e sinistra, e che si traduce praticamente 
nell'adozione di licenze libere, vale a dire licenze tramite le quali l'autore 
cede parte dei suoi diritti (economici) sull'opera indicando «ai fruitori 
dell'opera che essa può essere utilizzata, diffusa e spesso anche modifica- 
ta liberamente, pur nel rispetto di alcune condizioni essenziali». La li- 
cenza che viene scritta e adottata dalla FSF é la GNU/GPL (General Pu- 
blic License)". La GPL è un documento legale che viene associato al pro- 
gramma e che concede ai licenziatari il permesso di modificarlo, copiarlo 
e ridistribuirlo con o senza modifiche, gratuitamente o a pagamento. 
Una sua caratteristica peculiare, che la contraddistingue da altre licenze 
copyleft, è la cosiddetta “viralità”: 


Rispetto alle altre licenze di software libero, la GPL è classificabile 
come “persistente” e “propagativa” 

È “persistente” perché impone un vincolo alla redistribuzione: se l'u- 
tente distribuisce copie del software, deve farlo secondo i termini del- 
la GPL stessa. In pratica, deve distribuire il testo della GPL assieme al 
software e corredarlo del codice sorgente o di istruzioni per poterlo 
ottenere ad un costo nominale. Questa è la caratteristica principe del- 
la GPL, il concetto ideato da Richard Stallman e da lui battezzato co- 
pyleft. Il suo scopo è di mantenere libero un programma una volta 
che esso sia stato posto sotto GPL, anche se viene migliorato correg- 
gendolo e ampliandolo. 

È “propagativa” perché definisce nel testo una particolare interpreta- 
zione di "codice derivato", tale che in generale l'unione di un pro- 
gramma coperto da GPL con un altro programma coperto da altra li- 
cenza può essere distribuita sotto GPL, o in alternativa non essere di- 
stribuita affatto. Nel primo caso si dice che l'altra licenza è “compati- 
bile con la GPL’; nel secondo caso, che non lo è. Questa caratteristica 
è indicata come strong copyleft nella terminologia della FSE Il suo 
scopo è evitare che la persistenza venga via via indebolita apportando 


12 Cfr. la relativa voce di wikipedia: <http://it.wikipedia.org/wiki/Pubblico_domi- 
nio> (10/09). 

13 <http://it.wikipedia.org/wiki/Copyleft> (10/09). 

14 <http://www.gnu.org/licenses/gpl.html>. 
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modifiche coperte da un'altra licenza meno libera, inficiando così lo 
scopo di mantenere libero il software coperto dalla GPL". 


Dall'ambito ristretto del software, il concetto di copyleft invade il 
campo dei contenuti (testi, brani musicali, video) grazie a Lawrence Les- 
sig, professore di diritto pubblico prima a Stanford e oggi alla Harvard 
Law School, che nel 2001 fonda il progetto Creative Commons". 


Figura 1. Il simbolo del copyleft, una C rovesciata. 


Le licenze Creative Commons permettono di trasmettere parte dei 
diritti d'autore al pubblico. Nate negli Stati Uniti sono poi state adattate a 
numerosi sistemi giuridici, compreso quello italiano, dove il diritto d'au- 
tore è regolato dalla legge 633/41. Secondo l'art. 6 della legge sul diritto 
d'autore «il titolo originario dell'acquisto del diritto di autore è costituito 
dalla creazione dell'opera, quale particolare espressione del lavoro intel- 
lettuale» e tutti i diritti gli sono riservati. Viceversa, le licenze stabilisco- 
no in modo esplicito quali diritti sono riservati e quali vengono ceduti. 

Le licenze Creative Commons (CC) sono definite dalla combinazione 
di quattro attributi: 

1. Attribuzione: è l'unico attributo obbligatorio, che impone di indi- 
care l'autore dell'opera; 

2. Uso commerciale: si autorizzano o meno gli usi commerciali di 
un'opera; 

3. Opere derivate: si autorizza o meno la creazione di opere derivate 
dall'opera originale (come ad esempio le traduzioni); 


15 <http://it.wikipedia.org/wiki/GNU_General_Public_License> (10/09). 

16 Cfr. <http://creativecommons.org/>, anche in italiano all'URL <http://www.- 
creativecommons.it/>. Per le premesse teoriche del progetto di Lessig, si vedano: L. 
Lessig, Code and other laws of cyberspace, Basic books, London 1999; L. Lessig, Il fu- 
turo delle idee, Feltrinelli, Milano 2006 (ed. orig. 2003); L. Lessig, Cultura libera, Un 
equilibrio fra anarchia e controllo, contro l'estremismo della proprietà intellettuale, 
Apogeo, 2005 (ed. orig. 2004). 
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4. Condividi allo stesso modo: qualora si decida di modificare un'o- 
pera che ha questa condizione nella licenza, bisogna rilasciarla con la 
medesima licenza dell'opera originaria. 

La combinazione di questi attributi dà luogo alle licenze che seguono: 

1. Attribuzione: è necessario citare la fonte originale, mentre è possi- 
bile produrre opere derivate senza chiedere il consenso al titolare dei di- 
ritti d'autore sull'opera originale e usare l'opera a fini commerciali. 

2. Attribuzione-Condividi allo stesso modo: oltre all'obbligo di citare 
la fonte originale, richiede di applicare la medesima licenza. È consentito 
l'uso dell'opera a fini commerciali. 

3. Attribuzione-Non commerciale: oltre all'obbligo di citare la fonte 
originale, non consente di usare il testo a fini commerciali. 

4. Attribuzione-Non commerciale-Condividi allo stesso modo: oltre 
all'obbligo di citare la fonte originale e a impedire l'uso dell'opera a fini 
commerciali, richiede di applicare all'opera derivata la medesima licenza 
apposta all'opera originale. 

Le licenze CC hanno avuto ampia diffusione soprattutto in rete, e non 
mancano le applicazioni anche in ambito accademico. Il progetto Science 
Commons, coordinato da John Wilbanks, è finalizzato a questo specifico 
scopo". L'uso delle licenze Creative Commons favorisce la disseminazio- 
ne e il riuso della conoscenza. 

Si osservi che nel contesto in cui il software libero è nato e si è svilup- 
pato, 


l'etica rappresenta il collante e stabilisce lo standard di un comporta- 
mento accettato da chi sente di far parte di questo gruppo in cui la 
capacità, la conoscenza, l'interesse per il calcolatore sono gli elementi 
primari della comunicazione e la ragione dello stare insieme, e sono 
alla base di una organizzazione non gerarchica ma reticolare, basata 
sullo scambio e sull'interazione!*. 


Si diffonde cioè quella che viene definita etica hacker, un atteggia- 
mento di cui il mondo accademico può essere considerato il predecesso- 
re più antico”. Hacker è un termine tecnico, la cui definizione è stata 
spesso travisata e confusa col sabotatore di sistemi informatici (che si de- 
finisce, propriamente, cracker). Il Jargon file, un vocabolario del gergo 
usato dagli hacker e dai professionisti dell'IT, attualmente mantenuto da 
Eric S. Raymond, contiene le definizioni del termine hacker e le regole 
della netiquette, la buona educazione da rispettare in rete”. Gli hacker 


17 <http://sciencecommons.org/>. 

18 M. Berra, A.R. Meo, Informatica solidale, cit., p. 94. 

19 P. Himanen, L'etica hacker e lo spirito dell'età dell'informazione, Feltrinelli, Mi- 
lano 2001, p. 17. Cfr. anche S. Levy, Hackers. Gli eroi della rivoluzione informatica, 
Edizioni Shake Underground, Milano 1996-2002 (ed. orig. 1984). 

20 Cfr. <http://www.catb.org/-esr/jargon/>, e, in traduzione italiana, <http://jh- 
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sono programmatori convinti del fatto che «tutte le informazioni dovreb- 
bero essere libere» e che «l'accesso ai computer [...] dovrebbe essere illi- 
mitato e totale»?!, e sono orientati da un'etica del lavoro che affonda le 
radici nell'accademia e nell'etica del lavoro protestante. Scrive Himanen, 
citando Weber: 


“Quell'idea peculiare del dovere professionale, che oggi è così corrente 
eppure è tanto poco ovvia, in verità - l'idea di un dovere che l'indivi- 
duo deve sentire e sente nei confronti del contenuto della sua attività 
‘professionale’, quale che possa essere, e, in particolare, indipendente- 
mente dalla necessità che essa appaia, a una sensibilità ingenua, come 
pura valorizzazione della propria forza-lavoro o persino solo del suo 
possesso materiale (come 'capitale')”. Weber prosegue: “Indispensabi- 
le non è solo un forte senso di responsabilità, lo è, in genere, una 
mentalità che, almeno durante il lavoro, si liberi dalla continua que- 
stione: come, con la massima comodità e la prestazione minima, si 
possa tuttavia ottenere il salario abituale; e che, invece, svolga il lavo- 
ro come se fosse assolutamente fine a se stesso — vocazione", 


Esistono, tuttavia, anche importanti differenze tra il modello del vec- 
chio capitalismo e il modello aperto in cui gli hacker si riconoscono e 
operano, distribuendo liberamente i prodotti del loro lavoro affinché sia- 
no usati, migliorati e distribuiti da altri. Tale modello si rivela molto effi- 
cace anche in pratica, come dimostra il caso Linux, il sistema operativo 
creato dallo studente finlandese Linus Torvalds nei primi anni novanta. E 
vero che da principio Torvalds sviluppa il proprio sistema operativo 
mosso da necessità e curiosità personali, quasi per gioco”. Ma dal set- 
tembre 1991, quando il giovane hacker ne rilascia il codice sorgente in 
rete, qualcosa cambia. Nell'arco di pochi mesi decine, centinaia, migliaia 
e, infine, milioni di programmatori contribuiscono allo sviluppo di quel- 
lo che diventerà il primo sistema operativo libero usando Internet, il 
Web, gruppi di discussione, email e mailing list per discuterne gli svilup- 
pi, prendere decisioni, aggiungere moduli e migliorare quelli esistenti. 


Il lavoro di sviluppo é anche stato suddiviso in moduli indipendenti, 
attraverso i quali gruppi di hacker diversi creano versioni in competi- 
zione tra loro. Un gruppo composto da Torvalds e altri sviluppatori 
importanti avrebbe poi deciso quali di queste versioni sarebbero state 


anc.altervista.org/jargon/Intro.html» (10/09). Per una buona definizione, si veda 
la relativa voce di Wikipedia in inglese, «http://en.wikipedia.org/wiki/Jargon, File». 

21 P. Himanen, L'etica hacker, cit., p. 5. 

22 M. Weber, L'etica protestante e lo spirito del capitalismo, Rizzoli, Milano 1991 
(ed. orig. 1904-05), p. 77 e pp. 84-85, cit. in P. Himanen, L'etica hacker, cit., p. 18. 

23 L. Torvalds, D. Diamond, Rivoluzionario per caso. Come ho creato Linux (solo 
per divertirmi), Garzanti, Milano 2002 (ed. orig. 2001). 
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incorporate nella versione migliorata di Linux (e, naturalmente, an- 
che la struttura modulare di Linux crebbe gradualmente). Il gruppo 
di Torvalds non mantiene però alcuna posizione permanente di auto- 
rità. Il gruppo conserva la sua autorità soltanto per il tempo in cui le 
sue scelte corrispondono alle opinioni fatte proprie dalla comunità 
hacker. Se la scelta fatta dal gruppo-guida si dovesse rivelare meno 
che aperta, la comunità degli hacker procederebbe a sviluppare il pro- 
getto nella propria direzione, bypassando gli ex leader”. 


Si definisce così quello che Raymond definirà il modello bazaar, con- 
trapposto al modello cattedrale”. Se il secondo è un sistema di produzio- 
ne gerarchico in cui un gruppo ristretto di persone dirige e coordina le 
altre, nel primo, detto appunto modello bazaar, la creazione è aperta a 
tutti. Si tratta dunque di un modello aperto in quanto tutta l'informazio- 
ne viene messa a disposizione di chiunque in un processo di condivisio- 
ne in cui chi partecipa collabora a versioni sempre nuove, sempre mi- 
gliorate rispetto alle precedenti. La scienza è un commons, un bene che 
può essere goduto da una moltitudine di persone come lo sono le strade 
o lo erano i prati comuni degli inglesi prima delle recinzioni. Garret Har- 
ding in The Tragedy of Commons”, ha sottolineato una caratteristica par- 
ticolare di tali beni. 


Se posso portare le mie bestie al pascolo sul prato comune, rispetto 
alla mia utilità individuale è per me razionale cercare di sfruttarlo il 
più possibile, perché è gratis; ma in questo modo esaurisco il pascolo 
stesso, a danno di tutti gli altri. A chi viaggia piace trovare la strada li- 
bera; ma se tutti la usano contemporaneamente, perché è gratis, viag- 
giare diventa impossibile. Ecco la tragedia dei commons: i beni comu- 
ni, in quanto vengono usati in comune, tendono a venir sfruttati fino 
all'esaurimento. Tendono, cioè, se rimangono comuni, a cessare di es- 
sere beni”. 


Ma la scienza è un commons che sfugge alla sua tragedia, cioè al fatto 
che, essendo sfruttata da tutti, sia soggetta a esaurirsi. 


Una teoria scientifica è un commons non competitivo, perché chiun- 
que può apprenderla senza che nessun altro sia depauperato nel suo 
patrimonio di conoscenze. Una strada o un pascolo sono commons 
competitivi, perché un loro uso incontrollato li deteriora e li impove- 


24 P. Himanen, L'etica hacker, cit., pp. 57-58. 

25 E.S. Raymond, La cattedrale e il bazaar, Apogeo, Milano 1998 <http://www.a- 
pogeonline.com/openpress/cathedral> (edd. origg. 1997-2000). 

26G. Harding, The Tragedy of the Commons, «Science» 162, 1968, pp. 1243-1248, 
<http://www.sciencemag.org/cgi/content/abstract/162/3859/1243>. 

27 M.C. Pievatolo, Linux, la GPL e le virtù dimenticate dei beni pubblici, «Linux 
Magazine», 2004, <http://bfp.sp.unipi.it/~pievatolo/lm/commons.html>. 
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risce. Non bisogna fare l'errore di confondere i pascoli di erba con i 
pascoli delle idee: le idee, a differenza dell'erba, crescono se vengono 
condivise, e il loro valore aumenta, perché la condivisione dà loro la 
possibilità di svilupparsi e di migliorarsi?8. 


Gran parte dell’infrastruttura di Internet e del Web, così come i pro- 
getti di software open source come Linux, è tale che gli utenti, perseguen- 
do propri interessi, costruiscano in modo cumulativo un valore colletti- 
vo. 


Ognuno di questi progetti ha un piccolo nucleo centrale, meccanismi 
di estensione ben definiti e un approccio che consente a chiunque di 
aggiungere qualsiasi componente ben funzionante, facendo crescere 
gli strati più esterni di quello che Larry Wall, il creatore di Perl, defi- 
nisce "la cipolla" In altre parole, queste tecnologie dimostrano gli eff- 
etti della rete, semplicemente attraverso il modo in cui sono state pro- 
gettate”. 


Si osservi che tale modello, pur essendo inclusivo, è anche altamente 
meritocratico e selettivo. A titolo di esempio vale la pena ricordare il 
modo in cui la comunità di Debian, una delle più importanti distribuzio- 
ni Linux, ha regolamentato la partecipazione al suo sviluppo. Il Contrat- 
to Sociale di Debian con la comunità del software libero stabilisce regole 
rigide che devono seguire coloro che intendono collaborare alla scrittura 
del software, la prima delle quali (“Debian rimarrà libera al 100%”) costi- 
tuisce il principio fondamentale della comunità. La sua struttura si ispira 
a quella di una vera e propria società democratica, tanto che il documen- 
to che stabilisce la struttura organizzativa dei processi decisionali è chia- 
mato Costituzione. Tutti i partecipanti al progetto sono volontari (senza 
che ci sia un'azienda di riferimento che lo finanzi) e non esistono né una 
struttura gerarchica né ruoli dirigenziali, ad eccezione del Debian Project 
Leader, formalmente a capo del progetto, ma con funzioni principalmen- 
te rappresentative e di coordinamento, che è eletto con mandato annuale. 
Le decisioni più importanti vengono prese a maggioranza dagli sviluppa- 
tori Debian, i membri ufficiali del progetto che sono reclutati esclusiva- 


28 Ibidem. Si veda, su questo, C. Hess, E. Ostrom, Ideas, artifacts, and facilities: in- 
formation as a common-pool resource, «Law & Contemporary Problems», 66, 2003, 
111-146, <http://www.law.duke.edu/shell/cite.pl?66+Law+&+Contemp.+Probs. 
+111+%28WinterSpring+2003%29>, e in italiano, C. Hess, E. Ostrom (a cura di), La 
conoscenza come bene comune. Dalla teoria alla pratica, Mondadori, Milano 2009 (ed. 
orig. 2007). Ad ottobre di quest'anno la Ostrom è stata insignita, insieme a Oliver 
Williamson, del Premio Nobel per l'economia per l'analisi della governance e in par- 
ticolare dei beni comuni. 
29 T. O'Reilly, Che cos'è web 2.0, cit. 
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mente sulla base di criteri meritocratici (sulla base dei contributi scienti - 
fici apportati), ed eletti tramite votazione”. 

Himanen approfondisce infine la differenza tra i due modelli proposti 
da Raymond sulla base di un'altra analogia, quella tra la Scuola e l'Acca- 
demia platonica, dove lo spirito della prima è rappresentato dalla regola 
monastica di Benedetto”, mentre la seconda si fonda sulla libertà di cri- 
tica degli studenti, considerati compagni di apprendimento e non meri 
fruitori di nozioni. Gli hacker sono in ciò molto simili ai filosofi antichi, 
tanto che 


potremmo anche usare questa visione per creare un'accademia della 
Rete generalizzata, nella quale tutti i materiali di studio siano liberi di 
essere usati, criticati e sviluppati da tutti. Migliorando i materiali esi- 
stenti in nuove direzioni, il network produrrebbe continuamente mi- 
gliori risorse per lo studio degli argomenti che di volta in volta si pre- 
sentano. I membri del network sarebbero guidati dalle loro passioni 
per i vari temi e dal riconoscimento dei pari per i loro contributi?. 


2. L'avvento del movimento Open Access 


Nonostante l'evidente assonanza di questi princìpi con la pratica della 
comunicazione scientifica tradizionale, fatta eccezione per i casi sopra 
descritti, il mondo dell'accademia ha tardato a fare propri gli strumenti 
di comunicazione e, soprattutto, di pubblicazione che Internet e il Web 
hanno reso disponibili e accessibili. Se infatti è indiscutibile che l'uso del- 
l'email è diventato rapidamente una pratica comune, tra i ricercatori ha 
prevalso una forma di schizofrenia, che è stata descritta come sindrome 
del dr. Jeckyill e di Mr. Hyde”. Il primo usa attivamente la rete per fare 
ricerca, sfruttandone mezzi e strumenti quando è a caccia di fonti per 
scrivere i suoi testi; il secondo, continua a pubblicare con i mezzi tradi- 
zionali e ad accettare gli strumenti di valutazione nati e sviluppatisi nel 
vecchio sistema di comunicazione della scienza, adattandovisi. 

È solo tra il 2002 e il 2003, dunque che, sulla scia di alcune significati- 
ve esperienze pilota”, in ambito accademico si è cominciato a parlare di 


30 <http://www.debian.org/>. Si vedano anche Il Contratto Sociale Debian 
<http://www.debian.org/social_contract.it.html> e la Costituzione <http://www.de- 
bian.org/devel/constitution.it.html> (in versione italiana). 

31 «Parlare e insegnare spetta al maestro, tacere e ascoltare si addice al discepo- 
lo». Benedetto, La regola di San Benedetto e le regole dei Padri, Mondadori, Milano 
1995. 

32 P. Himanen, L'etica hacker, cit., p. 65. 

33 J.-C. Guédon, Per la pubblicità del sapere, cit. 

34 Si veda in particolare l'esperienza di ArXiv, l'archivio di pre-print di fisica, ma- 
tematica, informatica e biologia creato da Paul Ginsparg a Los Alamos nel 1991 e poi 
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letteratura scientifica Open Access, vale a dire letteratura «digitale, online, 
gratuita e libera da alcune restrizioni dettate dalle licenze per i diritti di 
sfruttamento commerciale». Condizioni rese possibili grazie alla rete e al 
consenso dell'autore (o del titolare dei diritti d'autore). 

Il movimento per l'accesso aperto alla letteratura scientifica nasce 
nella comunità accademica avviando una campagna in favore della con- 
divisione dell'informazione e della conoscenza, intese come beni comu- 
ni, e come soluzione al problema che affligge il mondo delle biblioteche e 
noto come “crisi del prezzo dei periodici”, vale a dire l'aumento vertigi- 
noso del costo degli abbonamenti alle riviste scientifiche. Su tale base, 
l'Open Access viene a trovarsi al centro di un ampio dibattito tra ricerca- 
tori, bibliotecari, amministratori di università e centri di ricerca, agenzie 
di finanziamento, editori e studenti. 

La fase politica del movimento è preceduta da uno stadio preliminare 
in cui si definiscono le specifiche tecniche dei software necessari alla 
creazione di archivi e riviste elettronici. L'archivio di Los Alamos creato 
da Paul Ginsparg sulla base del riconoscimento del fatto che il bisogno di 
scambiare risultati scientifici risponde a un fine diverso e complementare 
al modo in cui funziona il sistema delle pubblicazioni scientifiche, ha 
fornito lo spunto per la nascita di progetti simili, pur con un duplice si- 
stema organizzativo: agli archivi disciplinari come ArXiv si è accompa- 
gnata l'istituzione di archivi istituzionali, vale a dire archivi installati da 
un'istituzione (tipicamente un'università o un centro di ricerca) per rac- 
cogliere i prodotti dei ricercatori che vi afferiscono. «In breve, il movi- 
mento ha cominciato a crescere e ad espandersi fino a che è divenuta evi- 
dente la necessità di una sorta di azione federativa», necessità che ha tro- 
vato risposta a Santa Fe nell'ottobre 1999, quando furono definite le San- 
ta Fe Conventions. 


Lo spirito che presiedette all'incontro ricorda quello che guidava Vint 
Cerf e Bob Kahn quando progettarono la prima versione di ciò che è 
diventato il TCP/IP alla fine del 1973: ottimizzare il rapporto tra i ri- 
sultati e i vincoli tecnici nel tentativo di mantenere i secondi più bassi 
possibile”. 


L'esito è stato il protocollo Open Archives Initiative — Protocol for Me- 
tadata Harvesting (OAI-PMH), che rende possibile la raccolta dei meta- 
dati (classificati secondo l'ontologia Dublin Core sviluppata dalle biblio- 
teche statunitensi e ampiamente nota in ambito bibliotecario) dei docu- 


spostato alla Cornell University. Cfr. <http://it.wikipedia.org/wiki/ArXiv> (10/09) e 
<http://arxiv.org/>. Oggi ArXiv contiene oltre cinquecentosessantamila articoli. 

35 P. Suber, Breve introduzione all'accesso aperto, 2004, <http://www.aepic.it/docs/ 
OA/brief-italian.htm>. 

36 Si veda J.-C. Guédon, Per la pubblicità del sapere, cit. 

37 Ivi, p. 77. 
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menti depositati negli archivi Open Access. Nel 2001, la nascita di E- 
prints a Southampton, un software open source per la creazione di archivi 
digitali, cui sono seguiti il progetto D-Space del MIT, CDS-Ware del 
Cern, Fedora, e altri ancora, ha permesso il diffondersi di archivi aperti 
compatibili con OAI-PMH*. Lo stesso è avvenuto con software pensati 
per la creazione e la gestione di riviste digitali e ad accesso aperto (tra cui 
ricordiamo Open Journal Systems dell'università della British Columbia 
e l'italiano HyperJournal, creato col contributo di fondi PRIN). Le riviste 
OA sono oggi oltre quattromila”. 

In pratica, il movimento per l'accesso aperto si dota dunque di due 
canali: 

1. Gli archivi elettronici aperti, che non richiedono che i risultati de- 
positati siano stati preventivamente sottoposti a peer review e che posso- 
no essere istituzionali (come quelli di università e centri di ricerca), o di- 
sciplinari. Tali strumenti rientrano nella cosiddetta strategia verde 
(Green Road) per l'accesso aperto, il cui principale sostenitore è Stevan 
Harnad, professore di psicologia cognitiva all'Università di Southampton 
e tra i massimi esponenti del movimento". Tra i più noti archivi discipli- 
nari, oltre al già citato ArXiv, è utile ricordare RePEC, per le scienze eco- 
nomiche e E-LIS, per le scienze biblioteconomiche e dell'informazione. 
Ad ottobre 2009, la quasi totalità delle università e dei centri di ricerca 
dei paesi sviluppati si è dotata di archivi istituzionali“. 

2. Le riviste ad accesso aperto, che non sono diverse dalla riviste tra- 
dizionali se non in quanto rendono gli articoli da loro selezionati libera- 
mente disponibili al mondo. 


I loro costi consistono nella gestione dei processi editoriali, dal refe- 
raggio alla manipolazione dei manoscritti, allo spazio sul server. Le 
riviste ad accesso aperto coprono i propri costi in un modo molto si- 
mile alle radio e alle televisioni: coloro che hanno interesse alla disse- 
minazione dei contenuti pagano anticipatamente i costi di produzio- 
ne in modo che l'accesso alla lettura sia libero”. 


38 A ottobre 2009, Open DOAR (Directory of Open Access Repositories) <http:// 
www.opendoar.org/> e il Registry of Open Access Repositories (Roar) <http://roar.e- 
prints.org/» indicizzano oltre 1500 archivi OA. 

39 Si veda la Directory of Open Access Journals (DOAJ) <http://www.doaj.org/>, 
ospitata presso l'università di Lund. 

40 Gli scritti di Stevan Harnad sono liberamente accessibili online dalla sua ho- 
mepage: <http://www.ecs.soton.ac.uk/people/harnad>. 

41 G. van Westrienen, C.A. Lynch, Academic Institutional Repositories: Deploy- 
ment Status in 13 Nations as of Mid 2005, «D-Lib Magazine», 11, 9, 2005, 
<http://www.dlib.org/dlib/september05/westrienen/09westrienen.html>. Per una li- 
sta aggiornata degli archivi aperti in Europa e nel Nordamerica, si vedano 
<http://www.opendoar.org/countrylist.php?cContinent=Europe> e <http://www.o- 
pendoar.org/countrylist.php?cContinent=North%20America>. 
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Le riviste rientrano nella strategia definita come strada aurea (Gold 
Road) per l'accesso aperto. Tra queste, vale la pena menzionare PLOSo- 
ne, uno strumento essenziale per la ricerca biomedica pubblicato dalla 
Public Library of Science. 

Ma quali sono i modelli economici che rendono sostenibile la pubbli- 
cazione ad accesso aperto? 


Il modello editoriale tradizionale, nel campo della pubblicazione 
scientifica, funzionava nel modo seguente: 


1. l'autore cedeva gratuitamente i diritti alla riproduzione e allo sfrut- 
tamento economico del proprio testo all'editore; 

2. l'editore assicurava la disseminazione dell'opera dell'autore favoren- 
done indirettamente la carriera accademica, sulla base del “prestigio” 
della rivista da lui edita; 

3. le istituzioni di ricerca pubbliche assicuravano all'editore un ritorno 
economico o tramite il finanziamento della pubblicazione - in parti- 
colare per le monografie - con fondi di ricerca (modello “author 
pays’, molto diffuso in campo umanistico) o tramite abbonamenti da 
parte di biblioteche (prevalente per le riviste scientifiche). 


Lautore accettava questo scambio perché la stampa era una tecnolo- 
gia costosa, che richiedeva un investimento industriale e personale 
specializzato‘. 


Oggi è possibile disseminare la letteratura scientifica a basso costo 
usando gli archivi di preprint. Ma il problema di come finanziare le rivi- 
ste, rimane. 


Per quanto riguarda le modalità del loro finanziamento, va ricordato 
che il modello “author pays” basato sui contributi che il singolo auto- 
re versa, individualmente, per ogni pubblicazione, attingendo per lo 
più a fondi pubblici di ricerca, finisce col penalizzare gli autori di ec- 
cellenti contributi scientifici sprovvisti di sufficienti risorse finanzia- 
rie - evenienza, questa, tutt'altro che rara in anni di forte contrazione 
delle risorse destinate alla ricerca‘. 


Una soluzione consiste dunque nello spostare i finanziamenti dagli 
abbonamenti alle pubblicazioni (modello cosiddetto Institution pays). Le 


42 P. Suber, Breve introduzione all'accesso aperto, 2004, <http://www.aepic.it/docs/ 
OA/brief-italian.htm> (ed. orig. 2004). 

4 CRUI - Commissione Biblioteche, Gruppo OPEN ACCESS, Riviste ad accesso 
aperto: linee guida, 2009, pp. 9-10, <http://www.crui.it/HomePage.aspx?ref=1789>. 

44 Ivi, p. 10. 
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istituzioni accademiche, di fatto, finanziano già le pubblicazioni scientifi- 
che accollandosi i costi degli abbonamenti o coprendo direttamente le 
spese per la pubblicazione tramite i fondi di ricerca; dunque, 


la pubblicazione ad accesso aperto può diventare economicamente 
praticabile e addirittura conveniente se le istituzioni accademiche e di 
ricerca intervengono direttamente, preferibilmente in forma consor- 
tile, a sostenere i costi di pubblicazione di riviste di alto profilo scien- 
tifico^. 


Si osservino inoltre due fatti: in primo luogo, archivi e riviste non 
sono alternativi ma complementari; mentre le seconde assolvono al com- 
pito della disseminazione e restano strumenti essenziali ai fini della valu- 
tazione, i primi consentono la certificazione dei risultati e l'archiviazione 
di lungo periodo anche di quegli articoli che vengono pubblicati su rivi- 
ste ad accesso riservato. Il progetto SHERPA/RoMEO* indica le politi- 
che in materia di copyright dei principali editori commerciali, consenten- 
do agli autori di esercitare al meglio i propri diritti. Lo stesso Elsevier 
consente l'auto-archiviazione in repository OA dopo un periodo di pochi 
mesi (generalmente sei). In secondo luogo, dev'essere sottolineato il fatto 
che da tali definizioni restano fuori le monografie, uno strumento di 
pubblicazione essenziale nelle SSH. Le ragioni di tale assenza derivano 
probabilmente dal fatto che l'Open Access nasce nell'ambito delle STM in 
risposta alla crisi del prezzo dei periodici che interessa le pubblicazioni 
su riviste. Non mancano tuttavia iniziative volte a favorire la pubblicazio- 
ne di monografie digitali ad accesso aperto, spesso accompagnate alla 
tradizionale stampa su carta, come quelle di Open Humanities Press, e, 
in Italia, di Firenze University Press". 

Grazie alla diffusione di archivi e riviste, una sempre maggiore quan- 
tità di dati diviene liberamente disponibile sul Web. Ma è la filosofia poli- 
tica alla base del movimento a essere particolarmente interessante ai fini 
di questo discorso. Scrivono infatti i promotori della Dichiarazione di 
Berlino*. 


La nostra missione di disseminazione della conoscenza é incompleta 
se l'informazione non é resa largamente e prontamente disponibile 
alla società. Occorre sostenere nuove possibilità di disseminazione 
della conoscenza, non solo attraverso le modalità tradizionali ma an- 


45 Ivi, p. 11. 

46 <http://www.sherpa.ac.uk/romeo/>. 

47 Si vedano: <http://openhumanitiespress.org/>; <http://www.fupress.com/>. 

48 Nel 2009, la Dichiarazione di Berlino è stata sottoscritta da oltre duecentoses- 
santa istituzioni di ricerca (per un elenco completo dei firmatari, si veda 
<http://oa.mpg.de/openaccess-berlin/signatories.html>). 
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che e sempre più attraverso il paradigma dell’accesso aperto via Inter- 
net. 

[...] 

Per mettere in pratica la visione di un'istanza globale ed accessibile 
del sapere, il Web del futuro dovrà essere sostenibile, interattivo e tra- 
sparente. I contenuti ed i mezzi di fruizione (fools) dovranno essere 
compatibili e ad accesso aperto. 


Il collegamento tra tali affermazioni, la filosofia del movimento per il 
software libero e le premesse che hanno portato all'invenzione di Inter- 
net e del Web, che i sostenitori dell'accesso aperto estendono ai contenuti 
scientifici, è evidente. Il Web è refrattario all'uso di sistemi di filtro prece- 
denti alla pubblicazione per costituzione, che é invece una caratteristica 
dell'accademia come istituzione. Ma oggi una riflessione sui criteri di va- 
lutazione é al centro del dibattito di ricercatori, amministratori, finanzia- 
tori delle università, e tra questi e i governi. 


La separazione del processo di selezione dai vincoli tecnici ed econo- 
mici permette di guardare ad esso sotto una nuova luce e di riformu- 
larlo in modi che dovrebbero rispondere al bisogno degli scienziati in 
misura maggiore delle forme di valutazione più vecchie che sono 
emerse come tacito compromesso tra varie specie di vincoli concor- 
renti nel mondo della stampa.”. 


Se la tradizione della stampa confonde la disseminazione e la selezio- 
ne, perché gli alti costi di pubblicazione richiedono di essere selettivi, la 
pubblicazione elettronica e ad accesso aperto puó conciliare questi due 
aspetti. In altre parole diviene possibile costruire un sistema di comuni- 
cazione e di valutazione della scienza aperto e democratico poiché non 
basato su insiemi chiusi, il cui accesso è regolato da pochi oligopolisti 
privati. Le comunità di ricerca sono chiamate a reinventarlo. 

Per favorire l'affermarsi dell'accesso aperto, che ne é una condizione 
pregiudiziale, una tappa fondamentale è e sarà la definizione di mandati 
istituzionali, cioé di regolamenti che obblighino o incentivino i ricercato- 
ri che pubblicano i propri risultati con i fondi di una data istituzione 
pubblica a depositare i prodotti della ricerca nell'archivio della stessa isti- 
tuzione, o che stabiliscano criteri per incentivare la pubblicazione su rivi- 
ste Open Access. In tal senso, i dati al riguardo lasciano ben sperare per il 
futuro. Nel 2006, mentre qualche editore comincia a sperimentare politi- 
che OA, vengono sottoscritti oltre 50 policy in favore dell'accesso aperto e 
una decina di mandati. Nell'anno successivo nascono molti progetti di 
digitalizzazione, pubblicazione, archiviazione e numerosi servizi finan- 
ziati con fondi pubblici. Le policy sottoscritte dalle principali istituzioni 


49 J.-C. Guédon, Per la pubblicità del sapere, cit., p. 81. 
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pubbliche, associazioni scientifiche e università del mondo in favore del- 
l'accesso aperto ammontano a circa ottanta, mentre i mandati arrivano a 
venti. Un dato dell'ottobre 2009 ci indica che policy e mandati ammonta- 
no, ad oggi, a oltre centotrenta. Tra essi, è importante ricordare le linee 
guida dello European Research Council (ERC) del 2007 e del VII pro- 
gramma quadro dell'Unione Europea, che stabiliscono che tutte le pub- 
blicazioni validate da peer review derivanti da progetti di ricerca finan- 
ziati con fondi europei dovranno essere rese accessibili in un archivio 
istituzionale o disciplinare appropriato, entro 6 mesi dalla pubblicazione. 
Nella stessa direzione si muovono le politiche adottate da CNRS, Natio- 
nal Institutes of Health (NIH) negli Stati Uniti, Wellcome Trust, Max 
Planck Institut, le università di Harvard e di Stanford. 

Un passaggio ulteriore e decisivo sono le norme inserite nei sistemi di 
valutazione della ricerca britannico e australiano, le quali vincolano il 
processo di valutazione dei prodotti della ricerca al loro deposito in ar- 
chivi aperti. Collegando gli archivi aperti alle anagrafi della ricerca si sta- 
bilisce che il deposito in archivi OA è una precondizione necessaria (o 
un incentivo) per accedere ai finanziamenti pubblici alla ricerca. Le isti- 
tuzioni sopra citate sanno benissimo che la sopravvivenza della ricerca 
che finanziano molto dipende da come vengono impiegati. Nonostante la 
CRUI abbia di recente emanato delle Raccomandazioni in favore dell'ac- 
cesso aperto, l'Italia resta sotto questo profilo un fanalino di coda”. 


Documenti D Servizi 


e 
dati 


Applicazioni Policy 


Services e protocolli © 
(OAI-PMH) 


Internet, Web, Web semantico 


Figura 2. Open Access Layers Cake 


50 Per una recente rassegna sull'accesso aperto nel nostro paese, cfr. S. Mornati (a 
cura di), Open Access in Italia, «AIDAinformazioni», 26, 3-4 (fascicolo monografico), 
2008, <http://www.aidainformazioni.it/2008/342008monografia.html>. Le Racco- 
mandazioni della CRUI sono disponibili all'URL «http://www.crui.it/HomePage.a- 
spx?ref=1782>. 
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L'immagine sopra, costruita a mo' di riepilogo sulla scorta della torta 
a strati del Web semantico, indica gli elementi che costituiscono i tasselli 
dell'accesso aperto. Alla base si trova l'infrastruttura dell'informazione, 
Internet e il Web, mentre al piano superiore ci sono due elementi altret- 
tanti fondanti: i protocolli e i servizi web per permettono l'interscambio 
di metadati tra archivi e riviste ad accesso aperto, e una adeguata gestio- 
ne dei diritti d'autore. Al terzo piano vediamo le policy e le applicazioni 
grazie a cui è possibile creare archivi e riviste digitali. All'ultimo, invece, 
si trovano i servizi. Con questo termine intendiamo tutti quegli strumen- 
ti che rendono veramente fruibili dati e conoscenze veicolati tramite gli 
strumenti Open Access, al pari di quanto fanno Scopus di Elsevier e Web 
of Science di ISI-Thomson. 

Infatti, è indispensabile sottolineare che all'aumentare dei dati e dei 
risultati disponibili, sarà sempre più importante l'adozione di sistemi di 
filtro trasparenti, diffusi e in grado di selezionare l'informazione secondo 
criteri di qualità molteplici. 

In questa direzione si stanno muovendo le piattaforme e i servizi we- 
bometrici dei grandi editori e di imponenti progetti di digitalizzazione, 
primo tra tutti Google Scholar; nella stessa direzione, può andare l'Open 
Access, con il contributo degli strumenti del Web semantico e del Web 
2.0. 


3. Fare ricerca sul Web 3.0 


Ma quali differenze ci sono tra lo spazio a cui dà origine Google 
Scholar, e la prospettiva offerta da una convergenza tra Open Access e 
Web dei dati? 

I critici del colosso di MountainView osservano che alcuni aspetti 
della politica di Google non possono che presentare problemi. Questi 
aspetti comprendono il rapporto di Google con la pubblicità, le questioni 
dell'accentramento, del rispetto della privacy degli utenti e della censura 
dei contenuti. 

Relativamente al primo, non si può tralasciare il fatto che Google ge- 
stisce e organizza l'informazione traendo da queste operazioni enormi ri- 
cavi. Non esiste dunque un problema di conflitto di interessi? Detto in al- 
tri termini: come possiamo fidarci dell'oggettività dei risultati delle no- 
stre query, se da quei risultati (e dunque dai criteri adottati per seleziona- 
re l'informazione) dipendono i profitti di chi fa le ricerche per noi? Che 
cosa penseremmo se il bibliotecario che prende decisioni sugli acquisti di 
una biblioteca e sull'organizzazione dei suoi libri, si offrisse, nella mede- 
sima biblioteca, di fare pubblicità a uno o più editori, dietro compenso? 

Anche la questione dell'accentramento dei servizi messo in atto da 
Google genera qualche preoccupazione. Una politica tesa ad inglobare 
applicazioni e servizi sotto un unico marchio aziendale (si pensi alla re- 
cente acquisizione di Youtube, che consente a Google di gestire i milioni 
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di video messi online dagli utenti) presenta il pericolo di una deriva mo- 
nopolistica che rischia di trasformare l'intelligenza distribuita in un uni- 
co grande cervello al cui centro si trova un'azienda privata, mossa da in- 
teressi commerciali. 

Ma a destare le preoccupazioni maggiori sono i problemi relativi alla 
tutela della privacy e alla censura delle informazioni. 

È cosa nota, ammessa dallo stesso Google, che appositi software (det- 
ti crawler) leggano i nostri documenti online grazie ai loro servizi per 
fare indagini di mercato ed eseguire la cosiddetta profilazione, vale a dire 
adattare i risultati delle nostre ricerche a quelle che, sulla base del nostro 
comportamento, il sistema desume che siano le nostre preferenze. Il me- 
todo in cui questo avviene è analogo a quello che usa Amazon. Chiunque 
abbia acquistato un libro su Amazon.com avrà notato che, successiva- 
mente, ha cominciato a ricevere email in cui gli si suggeriscono altri libri 
che potrebbero essere di suo interesse. In pratica, ecco di quali dei nostri 
dati dispone: 


Google 

- conosce le nostre ricerche sul web (Google Search); 

- conosce la nostra navigazione sul web, i siti che visitiamo più spes- 
so, quanto tempo vi trascorriamo, quali link selezioniamo, e via di- 
cendo (Google Chrome, Google Toolbar); 

- conosce le notizie che più ci interessano e i siti di informazione che 
siamo soliti leggere (Google News); 

- sa su quali pubblicità clicchiamo (Google Adwords e Adsense), 

- gestisce e organizza milioni di documenti di intranet aziendali 
(Google Search Appliance e Google Mini); 

- conosce i nostri siti (Google Webmaster Tool), sa chi li visita, chi vi 
acquista e perché (Google Analytics), a volte addirittura li ospita 
(GooglePages & Blogger); 

- conosce le nostre transazioni online e il numero della nostra carta 
di credito (Google Checkout); 

- può leggere la nostra posta elettronica e dunque sa chi sono - alme- 
no in parte - i nostri amici e colleghi (Google Gmail); 

- può leggere la "messaggistica istantanea" che scambiamo con amici 
e colleghi (Google Talk); 

- può leggere i nostri documenti (Google Docs & Spreadsheet); 

- sa in quali locali vorremmo cenare... il sabato (Google Maps); 

- può pure fotografarli (Google Earth, Google Street); 

- conosce i nostri interessi culturali e le nostre letture preferite (Goo- 
gle Books Search); 

- conosce che cosa ci interessa nel mondo della ricerca accademica 
(Google Scholar); 

- conosce le nostre cartelle cliniche, sa chi è il nostro medico (Google 
Health); 

- sa come vogliamo arredare casa nostra (Google Catalog); 

- conosce i nostri appuntamenti (Google Calendar); 
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- conosce l’intero contenuto dell'hard disk del nostro computer (Goo- 

gle Desktop); 

- sa se siamo interessati alla Borsa e a quali azioni (Google Finance); 

- sa quali potrebbero essere i nostri prossimi acquisti (Google Froo- 
le); 

n chi sono i nostri amici, le nostre inclinazioni e i nostri interessi 

(Orkut); 

- sa quali sono le nostre foto preferite (Google Picasa); 

- sa quali sono i nostri video preferiti (Google Video, Youtube)*". 


In altre parole, conosce così tante informazioni su di noi che, incro- 
ciando anche solo alcuni dei nostri dati, è in grado ottenere un profilo 
molto preciso. Si tratta di un quadro inquietante, soprattutto alla luce del 
fatto che è una politica non trasparente, che non lascia all'utente la possi- 
bilità di scegliere quali informazioni fare circolare e tra chi. 

Anche il problema della censura, il cui esempio più lampante è quello 
della Cina, ha risvolti preoccupanti. Google Cina ha infatti accettato di 
censurare pagine “sgradite” al governo locale, una politica che ha giustifi- 
cato sulla base dell'assunto “meglio poco che niente”. Ma siamo sicuri che 
poco sia meglio di niente? Si osservi che Google rivendica l'oggettività 
dell'informazione che propone e dei criteri di selezione che adotta. Di- 
chiararsi oggettivi e censurare alcuni siti può essere considerata una poli- 
tica democratica di accesso all'informazione? 

Queste osservazioni ci conducono a riflettere sul modo in cui Google 
ci permette di ottenere informazioni e, soprattutto, conoscenza. Vincen- 
zo Letta considera tale questione sotto tre profili: oggettività, rilevanza e 
purezza dei risultati di una query. 


Per oggettività di un risultato intendo rappresentare il rapporto che 
esso ha con una idea di verità socialmente condivisa e se questa possa 
essere accolta o scambiata in certi casi per la verità. Si tratta di un 
punto estremamente complesso, perché investe concetti fondamentali 
del nostro pensiero e, sul piano della vitalità e buona salute di una 
cultura e di una democrazia, oserei dire cruciale. Dovremmo distin- 
guere tra diverse situazioni, prima di tutto fra quelle facilmente og- 
gettivabili e quelle che invece non lo sono. Ad esempio, se voglio sa- 
pere chi ha scritto i Promessi Sposi, potrò definire il risultato “Ales- 
sandro Manzoni” come vero, ma se voglio trovare il miglior sito che 
offra informazioni su un periodo storico, ad esempio la Guerra Civile 
Americana, non è detto che sia vero che i siti che mi vengono segna- 


51 V. Letta, In Google We Trust, cit., pp. 38-40. L'elenco dei servizi di Google è ag- 
giornato all'autunno 2008. Di recente (ottobre 2009), Google ha annunciato la nascita 
di Social Search, un servizio che consente a chi fa una ricerca di restringere i risultati 
di una query alle persone della sua sfera sociale <http://www.google.com/experimen- 
tal/>. 
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lati siano i migliori, dove per migliori possiamo intendere sommaria- 
mente i più documentati, chiari, liberi e aperti al confronto critico. 
Per rilevanza intendo quanto il risultato di una ricerca è vicino all'a- 
spettativa di chi ha effettuato quella ricerca. Ad esempio, se effettuo 
una ricerca con la chiave “apache” con l'intenzione di ricevere infor- 
mazioni sulla tribù indiana, mentre invece mi vengono segnalati siti 
che hanno a che fare con il server chiamato Apache, diremmo che 
quei risultati hanno una bassa rilevanza. 

Per purezza di un risultato, infine, intendo la sua completa e coerente 
dipendenza dai criteri pubblici che stanno alla base del funzionamen- 
to di un motore, senza che intervengano nascostamente altri fattori. 
Ad esempio, se io cerco “partiti politici italiani” dovrei ottenere la li- 
sta dei siti di tutti i partiti, senza che qualcuno di questi venga escluso 
perché nascostamente censurato dal motore”. 


In una nota, Letta chiarisce che per criterio pubblico non intende la 
pubblicità dell'algoritmo (che nel caso di Google, come si è osservato, è 
segreto) del motore di ricerca, bensì la filosofia che ne ispira il funziona- 
mento. 

«Nel caso di Google diremmo che la filosofia di fondo scelta per la 
valutazione di un sito considera il successo che questo ha ottenuto in ter- 
mini di link (sia quantitativamente che qualitativamente) come criterio 
per determinarne la qualità e il peso»*. Si tratta di un punto essenziale, 
poiché è sulla base di tale filosofia che Google valuta la qualità delle ri- 
sorse e stabilisce un ranking tra queste. 

Google definisce così come ciò avvenga: 


Basato sullo specifico carattere “democratico” del Web, PageRank 
sfrutta la vastissima rete di collegamenti associati alle singole pagine 
per determinarne il valore. In pratica, Google interpreta un collega- 
mento dalla pagina A alla pagina B come un “voto” espresso dalla pri- 
ma in merito alla seconda. Tuttavia, non si limita a calcolare il nume- 
ro di voti, o collegamenti, assegnati a una pagina. Oltre a effettuare 
questo calcolo, Google prende in esame la pagina che ha assegnato il 
voto. I voti espressi da pagine “importanti” hanno più rilevanza e 
quindi contribuiscono a rendere “importanti” anche le pagine colle- 
gate. PageRank assegna ai siti Web importanti e di alta qualità un 
“voto” più elevato di cui Google tiene conto ogni volta che esegue una 
ricerca”. 


Dunque, 


52 Ivi, p. 54. 
53 Ibidem. 
54 <http://www.google.it/intl/it/why_use.html>. 
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un link equivale a un voto; tutti i link non hanno lo stesso peso e 
quelli provenienti da un sito a sua volta molto linkato hanno un peso 
più alto. In altre parole, la qualità non è nient'altro che un prodotto 
della quantità, e, spingendosi ancora oltre, è oggettivo ciò che è pro- 
dotto dall'opinione della maggioranza. Si può essere dunque facil- 
mente portati a pensare che in un quadro del genere l'originale, l'ati- 
pico, il carattere singolare e tutto ciò che sia decisamente fuori dagli 
schemi fatichi ad essere intercettato, perché Google privilegia il dato 
comune, il valore medio, non l'eccezione e ciò che è minoritario. 
Come scrive Barbara Cassin “L'opinione dunque serve da punto di 
partenza e di arrivo, è misura e criterio di tutto. Essa definisce lo sta- 
tuto ontologico degli oggetti che sono sulla ragnatela e della classifi- 
cazione che ne fa Google”. 


Si tratta di una definizione di qualità piuttosto discutibile, in quanto 
rende nullo (perché invisibile o impossibile) il giudizio soggettivo dell'u- 
tente, che è colui che, alla fin fine, dovrebbe poter stabilire che cosa è eff- 
ettivamente valido secondo i suoi propri criteri. Confondendo quantità e 
qualità, e spacciando la prima per la seconda, un progetto come Google 
Scholar rischia di far sparire interi spazi di conoscenza che, pur periferi- 
ci, sono di valore. Abbiamo osservato che un motore di ricerca è in grado 
di rintracciare solo le risorse che si trovano nel nucleo centrale e nel con- 
tinente out del Web. Le pagine contenute nel primo e nel quarto conti- 
nente si possono raggiungere solo conoscendone l'URL, e per trovare 
quanto si trova nel deep Web (che è ricco di letteratura scientifica, 
“grigia” e no) sono necessarie tecniche avanzate di ricerca, che non pos- 
sono limitarsi all'uso di un motore. Perché dunque dovremmo conside- 
rare oggettivo un risultato che non copre l'intero Web e i cui criteri alla 
base sono oscuri”? Inoltre, il modo in cui Google funziona è tale da far sì 
che ciò che è popolare rimanga tale, mentre ciò che non si conosce, non 
si conoscerà mai. Ad assumere grande valore nella ricerca scientifica 


55 V. Letta, In google we trust, cit., p. 59; B. Cassin, Google-moi. La deuxième mis- 
sion de l'Amérique, Albin Michel, Parigi 2007, p. 104. 

56 «Non può esistere, contrariamente a ciò che hanno sognato gli editori del XIX 
secolo, la biblioteca universale, ma al massimo dei punti di vista specifici sull'univer- 
sale. Delle scelte si fanno sempre, obbligatoriamente. Si può valutare in più di cento 
milioni di opere stampate la produzione totale dell'umanità dopo Gutenberg (mi rife- 
risco solo all'Occidente). La quantità promessa da Google, cosi impressionante in ter- 
mini assoluti, corrisponde soltanto a una piccola percentuale di questa immensità. 
Bisogna quindi chiedersi quali libri verranno scelti e quali criteri interverranno per 
determinare la selezione. E se Google, consapevole di ció, annuncia un piano (incer- 
to) di selezione, il dibattito sulla sua validità e il suo eventuale imperialismo è non 
solo legittimo ma necessario, perché rischia di imporsi a spese dell'eredità di secoli e 
di saggia riflessione». J.-N. Jeanneney, Quand Google défie l'Europe. Playdoyer pour 
un sursaut, Mille et une nuits, Parigi 2006, p. 11, cit. in V. Letta, In google we trust, cit., 
p. 80. 
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sono molto spesso testi sconosciuti e introvabili, mentre scoprire qualco- 
sa di nuovo e originale a partire da quello che hanno letto tutti è assai 
difficile. Infine, se il criterio di seguire l'opinione della maggioranza è 
adottato da Google, non vale lo stesso per gli altri motori di ricerca; tan- 
to è vero che formulando la stessa query su diversi motori, si ottengono 
risultati molto differenti”. Se tutti usassimo solo Google, «l'algoritmo 
PageRank sarebbe un monarca digitale che governerebbe attraverso una 
moderna versione della tirannia della maggioranza». 

«Il fatto che anche attraverso i nostri click l'algoritmo PageRank de- 
termini il valore dei siti [...] è soltanto un sistema di valutazione di cui 
noi siamo indirettamente partecipi, ma al di fuori di una dimensione col- 
lettiva consapevole e strutturata», vale a dire di una comunità scientifica 
vigile e aperta. Vale infatti la pena ripetere quanto affermava Alessandro 
Figà-Talamanca nella sua critica all'Impact Factor, critica che ben si ap- 
plica anche a PageRank: «Un giudizio basato su scelte discrezionali oscu- 
rate da presunti parametri oggettivi è sottratto ad ogni critica e quindi 
potenzialmente arbitrario». 

In ambito scientifico, questi e altri problemi legati ai progetti di Goo- 
gle rivolti all'accademia, Google Print e Google Scholar, sono stati sotto- 
lineati soprattutto dai francesi che, con la collaborazione della Germania, 
hanno dato vita al programma europeo Europeana finanziato dal VII 


57 Questo sito permette di confrontare i risultati di una stessa query ottenuti 
usando Google e Yahoo «http://www.langreiter.com/exec/yahoo-vs-google.html». 

58 «[...] sul piano concettuale, è opportuno ricordare i rischi che discendono da 
questa tirannia della maggioranza, rifacendosi sommariamente al pensiero di colui 
che introdusse per la prima volta questo concetto nelle sue teorie politiche, ossia Ale- 
xis de Tocqueville. Nel confrontare i sistemi politici basati sulla gerarchia tra gli uo- 
mini e quello giovane americano, che invece si basava sull'eguaglianza, egli sostiene 
che non è vero che quest'ultimo si contrapponga ai primi perché in esso gli individui 
godano di una totale libertà di pensiero. Anche nella democrazia americana esistono 
costrizioni intellettuali, ma sono più nascoste e hanno una forma diversa da quelle 
degli stati dispotici. Se nei sistemi dispotici la tirannia si applicava a partire da vio- 
lenze e costrizioni fisiche, in quelli democratici questa violenza è rimasta, ma è di- 
ventata intellettuale. "Non conosco paesi" scrive Tocqueville "dove regni, in generale, 
meno indipendenza spirituale e reale libertà di discussione che in America (...) In 
America la maggioranza traccia un cerchio formidabile intorno al pensiero. Dentro 
questi limiti lo scrittore è libero; ma se osa uscirne cade in disgrazia (...) Il padrone 
non dice più: penserete come me altrimenti morirete; dice invece: siete liberi di non 
pensare come me; la vostra vita sarà salva e potrete mantenere i vostri beni; ma da 
quel giorno sarete stranieri tra noi". Cfr. Alexis de Tocqueville, Du pouvoir qu'exerce 
la majorité en Amérique sur la pensée, in De la Démocratie en Amérique, Flammarion, 
Paris, 1981, tome I, pp. 352-355». V. Letta, In google we trust, cit., p. 60. 

59 V. Letta, In google we trust, cit., p. 76. 

60 A. Figà-Talamanca, L'Impact Factor nella valutazione della ricerca e nello svi- 
luppo dell'editoria scientifica, IV seminario sistema informativo nazionale per la mate- 
matica 2000: un modello di sistema informativo nazionale per aree disciplinari, Lec- 
ce, 2000, <http://siba2.unile.it/sinm/4sinm/interventi/fig-talam.htm>. 
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programma quadro. Europeana dovrebbe contenere la digitalizzazione 
del patrimonio librario, museale e archivistico disseminato in Europa, 
ma nonostante le buone intenzioni e gli ingenti finanziamenti che ha ri- 
cevuto, in pratica stenta ancora a diventare un reale punto di riferimento 
per i ricercatori, anche per l'assenza di motori di ricerca ad hoc". 

Al contrario, il Web dei linked data e le reti sociali che lo abitano pos- 
sono offrire molto alla comunicazione scientifica, soprattutto se combi- 
nati con una politica Open Access. Il Semantic Web ha bisogno, per fun- 
zionare, di dati liberamente accessibili, interpretabili e fruibili. E l'accesso 
aperto può essere reso effettivamente godibile grazie ai servizi e agli stru- 
menti che la Web science sta sviluppando in modo completamente nuovo 
rispetto a quanto possiamo anche solo immaginare. L'impatto del Web 
semantico sulla comunicazione scientifica è in grado di trasformare l'at- 
tuale paradigma in diverse direzioni, non ultima quella che riconosce la 
necessità di impostazioni interdisciplinari che siano in grado di incrocia- 
re dati e strumenti provenienti da più fonti e discipline®: «l'innovazione 
nelle scienze si genera spesso nelle intersezioni»®. 


Nei prossimi anni, ci aspettiamo strumenti per la pubblicazione di ar- 
ticoli sul Web che siano in grado di aiutare gli utenti a includere auto- 
maticamente negli articoli che producono più mark-up comprensibile 
alle macchine. Mentre gli strumenti correnti che usano XML (Exten- 
sible Markup Language) possono consentire a un utente di asserire 
che una parte di un documento è relativo a un ‘esperimento’, i nuovi 
linguaggi consentiranno a uno scienziato di esprimere che l'esperi- 
mento fa uso di particolari sostanze e reagenti chimici; che il sistema 
utilizzato riguarda alcune materie organiche particolari; che l'esperi- 
mento ha prodotto gel che contengono determinate informazioni sul 
loro DNA (e che le immagini di questi gel si trovano in luoghi parti- 
colari del Web); e così via. [...] 

Il Web semantico fornirà le tecnologie sottostanti e unificanti che 
consentiranno a questi concetti di essere progressivamente collegati 
in una ragnatela universale di conoscenza (a universal web of know- 


61 <http://www.europeana.eu/portal/>. La Francia ha anche cercato di creare un 
motore di ricerca pubblico, Quero, finanziato nel 2008 dall'EU con quasi 100 milioni 
di Euro <http://en.wikipedia.org/wiki/Quaero>. Un altro progetto finalizzato alla ri- 
cerca di materiali scientifici pubblicati in archivi ad accesso aperto è DRIVER 
<http://www.driver-repository.eu/>. 

62 J. Hendler, Reinventing Academic Publishing, Part 1, «IEEE Intelligent 
Systems», 2007a, <http://www2.computer.org/portal/web/csdl/doi/10.1109/MIS.200- 
7.93>; J. Hendler, Reinventing Academic Publishing, Part 2, «IEEE Intelligent Sy- 
stems», 2007b, <http://www2.computer.org/portal/web/csdl/abs/html/mags/ex/2007 
/06/mex2007060002.htm>; J. Hendler, Reinventing Academic Publishing, Part 3, 
«IEEE Intelligent Systems», 2008, <http://www.computer.org/portal/web/csdl/abs/ 
html/mags/ex/2008/01/mex2008010002.htm>. 

63 P. Bourdieu, Il mestiere di scienziato, cit., p. 85. 
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ledge), aiutando così ad abbattere i muri eretti dalla carenza di infor- 
mazione e consentendo ai ricercatori di trovare e di comprendere i 
prodotti di altre discipline scientifiche. La nozione di rivista di medi- 
cina separata da una rivista di bioinformatica, distinta dagli scritti di 
fisici, chimici, psicologi e persino dai maestri d'asilo, un giorno di- 
venterà superata al pari di quanto sta accadendo con le riviste carta- 
cee per i nostri studenti™. 


In termini più generali, il processo di selezione può essere reso più 
democratico se diventa trasparente: innanzitutto, dovrebbe essere valuta- 
to tutto quanto viene prodotto, utilizzando magari una scala di valutazio- 
ne in luogo della mera accettazione o del solo rifiuto. 

Nel paradigma tradizionale, sono in pochi a decidere che cosa merita 
di essere letto: gli autori inviano il documento agli editor che lo trasmet- 
tono ai valutatori, e i cui giudizi vincolano gli editor nel decidere che 
cosa pubblicare. In un sistema più democratico, reso possibile dalle nuo- 
ve tecnologie, gli autori possono sottomettere i loro contributi a editor e 
valutatori, ma anche coinvolgere l'intera comunità scientifica in tale atti- 
vità, fino a sottoporre i testi che producono direttamente al giudizio del 
pubblico, combinando criteri formali e informali. 

Tra i primi rientrano il peer review e gli indici quantitativi di valuta- 
zione della qualità. Internet e il Web hanno consentito una trasformazio- 
ne sia del primo che dei secondi. 

In primo luogo, al peer review tradizionale si sono aggiunte nuove 
forme di valutazione qualitative. 

1. Il peer review ex post, una forma di certificazione della qualità ap- 
plicata a risultati già pubblicati in archivi (tipicamente sui preprint, cioè 
su articoli che non siano stati sottoposti a referaggio) tramite l'uso di 
overlay journal che selezionano il contenuto archiviato nei repository (ge- 
neralmente in forma di preprint ovvero di articoli non referati) validan- 
doli. 

2. L'open peer review, un'altra forma di peer review a posteriori appli- 
cato a risultati già pubblicati e sottoposti a referaggio. Un esempio consi- 
ste nel lasciare la possibilità di commentare il testo ai lettori in modo si- 
mile a quanto avviene sui blog®. 


64 T. Berners-Lee, J. Hendler, Scientific publishing on the semantic web’, «Nature 
debates», 2001, <http://www.nature.com/nature/debates/e-access/Articles/berner- 
slee.htm>. 

65 Cfr. J. Greaves et al, Nature's Trial of open peer review; E. Sandewall, Opening 
up the process. A hybrid system of peer review; T. Koop, U. Pòschl, An open, two-stage 
peer-review journal; E. Koonin, L. Landweber, D. Lipman, R. Dignon, Reviving a cul- 
ture of scientific debate; T. Groves, How can we get the best out of peer review? A recipe 
for good peer review (tutti gli articoli citati sono online all'URL del dibattito di 
«Nature» (2006), <http://www.nature.com/nature/peerreview/debate/index.html>. 
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3. Il soft peer review che consente di usare i metadati collaborativi 
archiviati su “online reference managers” come CiteUlike e Connotea, 
con la possibilità di gestire ampie quantità di dati, che sul Web sono già a 
disposizione. Nuovi strumenti e parametri di valutazione si basano sul- 
l'uso di metadati semantici, indicatori di popolarità, sistemi di rating as- 
segnati dai lettori (con un procedimento analogo a quello che avviene sul 
sito Venere.com, che permette di vedere i giudizi che gli utenti hanno 
dato sugli alberghi disponibili) e annotazioni collaborative da parte degli 
utenti. 

Il peer review ex post — che altro non è che un uso pubblico della ra- 
gione libero e illimitato - è oggi una reale alternativa al tradizionale peer 
review ex ante; se sommate alle pratiche tradizionali, le nuove forme di 
valutazione rese possibili dalla rivoluzione mediatica che stiamo vivendo 
possono essere un impulso in favore di una democratizzazione della co- 
municazione scientifica - e in particolare di un ampliamento del proces- 
so su cui si basa la valutazione dei risultati, che, come è noto, è un mo- 
mento fondamentale nella costituzione della Repubblica della Scienza. 

Riguardo agli indici quantitativi, si diffondono indici che si fondano 
sull'utilizzo di criteri basati non solo sulle citazioni ma anche su altre 
metriche, come ad esempio il download degli articoli, e che si configura- 
no come strumenti complementari ai primi. In tale direzione si 
muovono il progetto MESUR (MEtrics from Scholarly Usage of Re- 
sources) avviato da Herbert Van de Sompel, Johan Bollen e Marko 
Rodriguez del Los Alamos National Laboratory” e Usage Factors®, svi- 
luppato dallo United Kingdom Serials Group in collaborazione con 
COUNTER, entrambi del 2006. 


I vantaggi di una bibliometria basata sull'uso sono molteplici: 

- l'utilizzo di un articolo può essere tracciato dal momento stesso in 
cui l'articolo (come preprint o postprint) viene messo in rete, mentre 
le citazioni sono calcolabili solo dopo un dato lasso di tempo che va- 
ria dai tre ai sei mesi successivi alla pubblicazione, ma che si riduce se 
l'articolo viene depositato in rete prima ancora della sua pubblicazio- 
ne; 

- l'uso puó essere misurato per una varietà di documenti, capitoli di 
monografie, presentazioni, audio, video, dati primari della ricerca e 
non si limita a misurare l'impatto dell'articolo scientifico; 


66 Cfr. D. Taraborelli, Soft peer review: social software and distributed scientific 
evaluation, 2008, «http://nitens.org/docs/spr coop08.pdf >. 

67 <http://www.mesur.org/MESUR.html>. J. Bollen, M.A. Rodriguez, H. Van de 
Sompel, MESUR, usage-based metrics of scholarly impact, 2007, «http://www.mesur- 
.org/Documentation_files/JCDL07_bollen.pdf>. 

68 <http://www.uksg.org/usagefactors >. 
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- l'uso può riflettere molti differenti aspetti dell'impatto della ricerca 
scientifica. 


Un sistema che consente l'applicazione di queste nuove forme di valu- 
tazione é ipotizzato da Brian Whitworth e Rob Friedman e sintetizzato 
nello schema che segue. Si tratta di un modello intenzionalmente generi- 
co, un ibrido tra un archivio elettronico e una rivista elettronica, che 
consente un doppio canale di pubblicazione (quello tradizionale, basato 
sulla revisione anonima da parte dei pari e uno diretto, che permetta la 
pubblicazione immediata) associato a una scala di valutazione di sei gra- 
dini che va dall'eccellente allo sconsigliato, e che comprende anche la ca- 
tegoria “not rated" (non valutato)”. 


Every Month 
l | ae | 
| ae | ive 


Excellent 
Very Good 
Rating 
A System 
idequate 
Limited 


Recommended 


Publish 


a o New 
|o Anonymous ape son | Expert | Anonymous ape son | +" subiiissions 


Reject 


Figura 4. Architettura di un sistema di comunicazione 
scientifica aperto 


Un sistema di filtraggio preliminare potrebbe consistere nell'identifi- 
care, tramite la registrazione, i membri dell'accademia in modo che que- 
sta qualifica risulti tra le caratteristiche di chi valuta. Ma nel sistema pro- 
posto da Whitworth e Friedman i rating dei lettori possono sommarsi a 
quelli degli esperti, lasciando al lettore la scelta tra quali criteri far preva- 


69 M. Cassella, La valutazione della ricerca nelle scienze umane, cit. 

70 B. Whitworth, R. Friedman, Reinventing Academic Publishing online. PART II. 
A Socio- Technical Vision, «First Monday», 14, 9, 2009, «http://firstmonday.org/htbin/ 

cgiwrap/bin/ojs/index.php/fm/article/view/2642/2287>. 
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lere e includendo metriche di valutazione sia ex ante che ex post, in 
modo analogo a quanto suggerito da Jean-Claude Guédon: 


Invece di essere immediatamente sottoposto a peer review e a copy- 
editing per essere pubblicato, l'articolo è semplicemente passato a un 
vaglio di credibilità e di idoneità. Quindi, viene messo online e offer- 
to allesame e ai commenti degli specialisti della comunità di riferi- 
mento. Le istruzioni e le procedure sviluppate su PLoS One per gli in- 
terventi del lettore potrebbero essere facilmente adattate agli archivi, 
da prima singolarmente e quindi in gruppi. Non sarebbe difficile 
creare un secondo criterio di valutazione oltre al peer review che po- 
trebbe aiutare a valutare il valore di un dato articolo per una determi- 
nata comunità. In questo modo, il legame tra i testi contenuti in un 
archivio e le varie comunità di ricercatori sarebbe molto più forte e 
navigare tra ricerca all'avanguardia diventerebbe uno sforzo di grup- 
po molto meglio coordinato”!. 


Rendendo accessibile tutto, i criteri di selezione e di valutazione, non 
più dipendenti dal marchio della rivista o dall'algoritmo della ricerca, 
possono cambiare in modo che la qualità torni al centro del discorso. 

I sistemi di filtraggio resi possibili dal Web semantico sono molto effi- 
caci soprattutto quando l'opinione dell'utente è diversa da quella della 
media della popolazione. Resta, certo, molto da fare in tal senso. In pri- 
mo luogo, bisogna identificare le fonti di informazione affidabile, in 
modo, poi, da sviluppare meccanismi che inferiscano la fiducia in modo 
accurato da fonti meno sensibili dei grandi connettori. Le relazioni so- 
ciali di fiducia, implementate sul Web, possono trasformare il modo in 
cui gli scienziati usano la rete. Al crescere della quantità di contenuti ge- 
nerati dagli utenti, cresce anche il bisogno di un approccio sociale al fil- 
traggio dell'informazione". 

A tal fine, l'interoperabilità è una condizione necessaria, ma non è 
sufficiente. Gli archivi e le riviste digitali non dovranno restare meri stru- 
menti di pubblicazione, ma diventare più usabili, cioè più utili all'attività 
della ricerca. L'apporto del Web semantico potrà rendere effettivo lo svi- 
luppo del loro potenziale computazionale, una vera rivoluzione nell'atti- 
vità della ricerca stessa. I servizi che un sistema aperto come quello pro- 
gettato potrebbe supportare e che consentirebbero di tracciare meglio il 
valore dei prodotti scientifici sono molteplici. In primo luogo, è essenzia- 
le che i materiali sottoposti a peer review siano identificati chiaramente 
come tali, anche grazie a motori di ricerca ad hoc. In più, oltre ai sistemi 
per misurare l'impatto citazionale attraverso indici diversi, e a metriche 
d'uso, come quelle sviluppate da progetti come MESUR e Usage Factors, 


71 J.-C. Guédon, Open Access. Contro gli oligopoli nel sapere, cit., p. 83. 
72 Cfr. J. Golbeck, Weaving a Web of Trust, «Science», 321, 5896, 2008, pp. 1640 - 
1641, <http://www.sciencemag.org/cgi/content/short/321/5896/1640>. 
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è importante offrire strumenti che consentano la possibilità di effettuare 
peer review ex post, vale a dire di commentare, correggere, integrare un 
articolo (possibilità che offre PLOSone) e far visualizzare ai lettori i ra- 
ting di reputazione di autori e valutatori, funzioni del tipo same again 
(come su Amazon), sistemi di bookmark sociali, e strumenti per rendere 
più efficace il riconoscimento univoco di un autore”. Simili criteri di va- 
lutazione, basati su forme di accreditamento sociale, possono essere 
combinati e usati come strumenti per assegnare fondi di ricerca e per de- 
cidere in merito al reclutamento e alle promozioni. 

Poiché il riconoscimento nell'accademia è fondamentale, quelli pro- 
posti possono risultare meccanismi essenziali per indurre i singoli a trar- 
ne vantaggio e, assieme, a dare beneficio alla loro comunità, soprattutto 
in un momento in cui l'università è accusata dall'opinione pubblica di 
non valorizzare il merito. L'esempio della nascita e dell'evoluzione di In- 
ternet, del software libero e del Web ha mostrato e dimostra che è un si- 
stema che funziona; per questo, e non solo perché è giusto, vale la pena 
esplorarne le possibilità. 


73 Alcuni esempi di siti che usano strumenti come quelli descritti sono: <http://- 
pool.newmedia.umaine.edu/index.php»; <http://www.scribd.com/>;  <http://pkp.- 
sfu.ca/integration/>; <http://www.myExperiment.org>. 


CONCLUSIONI 


Alice è una ricercatrice di filosofia e insegna in un'università italiana. 
Ha pubblicato articoli, saggi e monografie, e ogni anno partecipa a con- 
ferenze e convegni in giro per il mondo. Per lavorare, Alice usa la rete. 

Lo scorso anno, ad esempio, ha tenuto un corso sul Conflitto delle fa- 
coltà, per preparare il quale ha tradotto due capitoli dall'Akademie Au- 
sgabe dell'opera di Kant, tutta online e ad accesso aperto, curata e pubbli- 
cata dall'università di Bonn'. Per lavorare sui testi, ha utilizzato due di- 
zionari tedeschi importanti del tempo: lo Zedler Universal Lexicon e il 
Deutsche Woerterbuch dei fratelli Grimm, anch'essi completamente on- 
line. Ha pubblicato le sue traduzioni su una rivista ad accesso aperto con 
una licenza Creative Commons (Attribuzione-Condividi allo stesso 
modo) tale che, se altri studiosi decidono di utilizzarla volendo modifi- 
carne alcune parti, possono farlo senza chiederle il permesso (devono 
solo citarla come fonte originale e pubblicare la loro traduzione alle stes- 
se condizioni). In verità, un professore di un'altra università le ha scritto 
dicendole che aveva trovato la sua traduzione molto utile; l'aveva utiliz- 
zata per un seminario di dottorato su Kant. Voleva solo ringraziarla. 

La traduzione della seconda parte del Conflitto delle facoltà completa 
un progetto di ricerca che Alice ha avviato qualche anno prima, e che 
comprende la traduzione degli scritti politici kantiani. Alice ha pubblica- 
to le traduzioni dei saggi, man mano che erano pronte, su riviste peer re- 
viewed, depositandole prima nell'archivio istituzionale della sua universi- 
tà, e anche in appositi archivi disciplinari. Nel tempo, ha potuto verifica- 
re quanto sono state utilizzate, controllando il numero di download dei 
suoi testi dai suddetti archivi. Di uno di questi ha pubblicato un'edizione 
riveduta, tradotta da una collega che l'aveva rilasciata con la medesima 
licenza. Cosi, ha risparmiato tempo e lavoro inutile. Perché reiventare la 
ruota, se c'é già? Si é detta. Per correttezza, ha avvertito la collega, ringra- 
ziandola per il lavoro svolto. Non sarebbe stato necessario perché la li- 
cenza non lo richiedeva. La collega ha a sua volta risposto: "Sono felice di 


1 <http://www.ikp.uni-bonn.de/kant/> . 
2 <http://www.zedler-lexikon.de/>; <http://germazope.uni-trier.de/Projects/DWB>. 
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aver contribuito al suo progetto kantiano. [...] Adotterò il suo libro per il 
mio corso”. 

Nel frattempo, Alice ha sottoposto il suo progetto al comitato scienti- 
fico della collana del suo Dipartimento, che pubblica con Lulu.com. Lulu 
è un editore online, che offre servizi editoriali su scala globale e a prezzi 
molto vantaggiosi. Attribuisce gratuitamente l'ISBN ai volumi, e offre 
servizi di diffusione nei principali canali di distribuzione online (i libri 
sono inseriti nei cataloghi di Amazon, Barnes&Noble e Internet Book 
Shop, e nei principali database bibliografici) e attraverso i social network. 
Ma i libri possono essere ordinati anche in libreria. Grazie all'accordo 
che il suo Dipartimento ha siglato con Lulu, il prezzo di 100 copie del 
suo libro è sceso a 3 euro a copia, in luogo dei 13 euro che proponeva l'e- 
ditore tradizionale con cui il Dipartimento pubblicava la sua collana in 
precedenza. 

Per gli studenti, inoltre, Alice ha preparato un commentario agli 
scritti politici di Kant. È stato un lavoro molto lungo, perché la letteratu- 
ra secondaria sul tema è estremamente vasta. In questa fase, Alice ha im- 
postato il suo browser nella modalità “lavoro” e ha stabilito alcuni criteri 
di ricerca ad hoc. Alle fonti pubblicate su siti accademici peer reviewed ha 
assegnato il massimo di affidabilità; a un gradino sotto ha collocato gli 
articoli presenti negli archivi disciplinari e istituzionali, non peer re- 
viewed. Inoltre, ha indicato al browser i 4 motori di ricerca su cui impo- 
stare le sue query, dei quali uno è un motore specifico per le fonti accade- 
miche, e uno è un motore semantico, che cerca i dati nei diversi database 
aperti sparsi sul Web. Ha impostato il browser in modo da ripetere le 
query sui diversi motori, oltre che in italiano, in tedesco, inglese, francese 
e spagnolo. 

Ogni volta che ha trovato qualcosa di utile e interessante l'ha registra- 
to su Citeulike, che ospita la sua bibliografia di lavoro, contrassegnando 
la singola fonte con parole chiave e indicandola come già letta o da legge- 
re (e con quale urgenza). Quando ha trovato pagine Web non stretta- 
mente accademiche, le ha archiviate su Delicious, un sistema di social 
bookmarking che permette di indicizzare le fonti in modo meno struttu- 
rato di quanto non faccia Citeulike. Grazie a Citeulike, navigando trami- 
te i tag delle folksonomie associati alle sue fonti, ha trovato molti testi, ci- 
tati da altri ricercatori, che non conosceva, e li ha aggiunti alla sua biblio- 
grafia. Alla fine di ogni giornata di lavoro, ha passato in riepilogo i risul- 
tati della sua ricerca, ha scremato tra i risultati i meno rilevanti ed ha ag- 
giunto tra le fonti affidabili gli autori i cui articoli ha ritenuto più validi. 
Cosi, quando il mattino dopo ha ripreso a lavorare, il browser ha utiliz- 
zato questo ulteriore criterio di selezione delle fonti. 

Alla fine, Alice ha pubblicato il suo commentario online in forma di 
ipertesto, inserendo i link alle traduzioni di Kant, e all'originale. Gli stu- 
denti hanno cosi accesso a Kant a piü "strati": dal commentario ai testi in 
traduzione, e dalle traduzioni agli originali in tedesco. Grazie a un wiki, 
gli studenti possono inoltre inserire commenti e domande, che sono mo- 
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derati dalla docente e, una volta pubblicati, accessibili a tutti. Un profes- 
sore di liceo, ad esempio, le ha scritto per dirle di aver usato i suoi mate- 
riali didattici per le lezioni. 

Una versione cartacea del commentario è stata inserita nella seconda 
edizione degli scritti politici pubblicata da Lulu. Gli studenti di Alice 
possono stamparsi direttamente l'ipertesto e le traduzioni dal Web, ma 
anche comprare il libro ad un prezzo ragionevole, direttamente dal sito 
di Lulu o attraverso altri canali. Il Sistema bibliotecario dell'Ateneo del- 
l'Università in cui Alice lavora ne ha comprate qualche centinaio di copie 
a 3 euro, e offre questo servizio agli studenti, vendendole loro al doppio. 
Così aiuta il Dipartimento a coprire il costo per la gestione della collana. 

Alice ha poi scritto un articolo, rivolto a un pubblico più specialistico, 
illustrando alcune delle scoperte che ha fatto nel corso della sua ricerca e, 
nell'arco di pochi mesi, è stata invitata a partecipare a un convegno inter- 
nazionale dedicato a Kant presso l'università di Manchester, dopo che un 
collega inglese aveva trovato il suo articolo su una rivista open access in- 
dicizzata su DOAJ. 

Lo scorso anno, Alice ha avuto un buon ranking nella valutazione del- 
la sua ricerca, calcolato sulla base di diversi indicatori che hanno tenuto 
conto, oltre che della quantità totale delle sue pubblicazioni, del rapporto 
tra pubblicazioni peer reviewed e numero totale, della media dei down- 
load dei suoi articoli in sei mesi, un anno, due anni e cinque anni, dell'in- 
dice h calcolato sugli archivi aperti compatibili con OAI-PMH e su Goo- 
gle Scholar, e anche dei giudizi qualitativi che altri ricercatori universitari 
hanno dato dei suoi testi, aggregati tramite un servizio del CINECA. Una 
percentuale dei suoi fondi sono destinati a finanziare la collana del Di- 
partimento su Lulu e a pagare la stampa delle sue pubblicazioni. Ma con 
quello che le resta potrà fare anche altro: acquistare libri, partecipare alle 
conferenze che le interessano, finanziare lo sviluppo di software open 
source necessari alla sua attività di ricerca o progetti di digitalizzazione, e 
molto altro ancora. 


Questa storia non è un'utopia filosofica. L'ottanta per cento è una sto- 
ria vera, perché gli strumenti di cui narra sono già disponibili. Il restante 
venti per cento è parte della storia di un futuro molto prossimo. Parafra- 
sando la copertina del Times del primo gennaio 2007 dedicata agli utenti 
del Web?, senza eccessi di ottimismo potremmo dunque concludere di- 
cendo: “Alice sei tu. Sì, proprio tu. Sei tu a controllare la tua ricerca. Ben- 
venuto nel tuo mondo”. 


3 <http://www.time.com/time/covers/0,16641,20061225,00.html>. 
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